Розбіжності

Тут показані розбіжності між вибраною ревізією та поточною версією сторінки.

Посилання на цей список змін

rod:wi [2012/11/30 12:33]
Євген Слюсар створено
rod:wi [2012/12/10 19:48] (поточний)
Рядок 1: Рядок 1:
 ====== Робочі інструкції для чергового оператора ====== ====== Робочі інструкції для чергового оператора ======
 +===== Методология работы =====
 +Основной портал ​ для контроля за работой грид инфраструктуры ​
 +[[https://​operations-portal.egi.eu/​dashboard |Central Operations Portal]]
  
 +{{ rod:​1.png?​700x250 }}
 +
 +Операционный дежурный (как член команды РОД) должен ​ проверять данные портала минимум 3 раза в день. В выходных дни — хотя бы один раз в день, контролируя ​ информацию об открытых тикетах.
 +Для доступа на портал необходимо импортировать сертификат в браузер.
 +
 +
 +Последовательность работы с порталом:​
 +  - Открываем начальную страницу портала .
 +  - Открываем вкладку c опцией «sites in my scope» (сайты за которые отвечает член РОД) – проверяем на количество алертов и время действия алертов.
 +
 +{{ rod:​2.png?​700x250 }}
 +===== Работа с алертами =====
 +
 +В зависимости от времени жизни алерта выполняем следующие действия:​
 +  * 0-24 – Если показано что время жизни алерта менше 24 часов, член команды ждет пока администратор в течении этого времени отреагирует на алерт или уйдет в даунтайм. Реакция администратора:​ либо исправить ошибку,​ либо уйти в даунтайм,​ связаться с членами РОД для консультации.
 +  * 24-72 – Если же время жизни алерта находиться в периоде от 24 часов до 72 – РОД обязан открыть тикет! (смотри Рис.4) и дождаться реакции на тикет в течении этого времени. Когда открыт тикет – Алерт закрывается (в табличке выводящейся при закрытии,​ выбирается привязка к тикету,​ который был открыт членом РОД.)
 +  * >72 – Если время жизни алерта больше 72 часов, то это плохой знак.
 +Это означает,​ что команда РОД плохо справилась со своей работой и был пропущен ​ алерт, так как был пропущен процесс открытия тикета,​ процесс закрытия алерта. (!!!)
 +Алерты с таким временем жизни являются критическими для Индекса эффективности команды РОД ​ (смотри вкладку ROD performance index for NGI : NGI_UA https://​operations-portal.egi.eu/​dashboard/​rodOlaMetrics).
 +
 +{{ rod:​3.png?​700x250 }}
 +
 +Крайняя левая кнопка «Закрытие алерта» в статусе «Critical» позволяет закрыть алерт ​ когда:
 +  - Сервис в режиме «Downtime». Состояние «Downtime» отображается в строке сайта специальным символом. ​
 +  - Не обновилась информация в операционном портале (необходимо ​ проверить так ли это: закрыт ли тикет и соответствующий тест в системе Nagios (https://​mon-ua.bitp.kiev.ua/​nagios/​) показывает статус «ОК», создать тикет с проблемой )
 +  - Не обновились Nagios тесты (создать тикет с проблемой и ввести номер созданого тикета в формочку)
 +
 +{{ rod:​4.png?​700x250 }}
 +
 +После того как тесты в нагиусе прошли удачно и статус алерта стал ОК – РОД должен просто его закрыть.
 +
 +{{ rod:​6.png?​700x250 }}
 +===== Работа с тикетами =====
 +
 +Кнопка открытия Тикета очень проста ​ для пользования – нажимаете,​ вводите текст – тикет готов. ​
 +Тикеты к Алертам создаються только отсюда (из Дашбоарда),​ не в коем случае из GGUS.(!!!)
 +
 +{{ rod:​5.png?​700x250 }}
rod/wi.1354278822.txt.bz2 · В останнє змінено: 2012/11/30 12:33 (зовнішнє редагування)
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0