Тут показані розбіжності між вибраною ревізією та поточною версією сторінки.
rod:wi [2012/11/30 12:33] Євген Слюсар створено |
rod:wi [2012/12/10 19:48] (поточний) |
||
---|---|---|---|
Рядок 1: | Рядок 1: | ||
====== Робочі інструкції для чергового оператора ====== | ====== Робочі інструкції для чергового оператора ====== | ||
+ | ===== Методология работы ===== | ||
+ | Основной портал для контроля за работой грид инфраструктуры | ||
+ | [[https://operations-portal.egi.eu/dashboard |Central Operations Portal]] | ||
+ | {{ rod:1.png?700x250 }} | ||
+ | |||
+ | Операционный дежурный (как член команды РОД) должен проверять данные портала минимум 3 раза в день. В выходных дни — хотя бы один раз в день, контролируя информацию об открытых тикетах. | ||
+ | Для доступа на портал необходимо импортировать сертификат в браузер. | ||
+ | |||
+ | |||
+ | Последовательность работы с порталом: | ||
+ | - Открываем начальную страницу портала . | ||
+ | - Открываем вкладку c опцией «sites in my scope» (сайты за которые отвечает член РОД) – проверяем на количество алертов и время действия алертов. | ||
+ | |||
+ | {{ rod:2.png?700x250 }} | ||
+ | ===== Работа с алертами ===== | ||
+ | |||
+ | В зависимости от времени жизни алерта выполняем следующие действия: | ||
+ | * 0-24 – Если показано что время жизни алерта менше 24 часов, член команды ждет пока администратор в течении этого времени отреагирует на алерт или уйдет в даунтайм. Реакция администратора: либо исправить ошибку, либо уйти в даунтайм, связаться с членами РОД для консультации. | ||
+ | * 24-72 – Если же время жизни алерта находиться в периоде от 24 часов до 72 – РОД обязан открыть тикет! (смотри Рис.4) и дождаться реакции на тикет в течении этого времени. Когда открыт тикет – Алерт закрывается (в табличке выводящейся при закрытии, выбирается привязка к тикету, который был открыт членом РОД.) | ||
+ | * >72 – Если время жизни алерта больше 72 часов, то это плохой знак. | ||
+ | Это означает, что команда РОД плохо справилась со своей работой и был пропущен алерт, так как был пропущен процесс открытия тикета, процесс закрытия алерта. (!!!) | ||
+ | Алерты с таким временем жизни являются критическими для Индекса эффективности команды РОД (смотри вкладку ROD performance index for NGI : NGI_UA https://operations-portal.egi.eu/dashboard/rodOlaMetrics). | ||
+ | |||
+ | {{ rod:3.png?700x250 }} | ||
+ | |||
+ | Крайняя левая кнопка «Закрытие алерта» в статусе «Critical» позволяет закрыть алерт когда: | ||
+ | - Сервис в режиме «Downtime». Состояние «Downtime» отображается в строке сайта специальным символом. | ||
+ | - Не обновилась информация в операционном портале (необходимо проверить так ли это: закрыт ли тикет и соответствующий тест в системе Nagios (https://mon-ua.bitp.kiev.ua/nagios/) показывает статус «ОК», создать тикет с проблемой ) | ||
+ | - Не обновились Nagios тесты (создать тикет с проблемой и ввести номер созданого тикета в формочку) | ||
+ | |||
+ | {{ rod:4.png?700x250 }} | ||
+ | |||
+ | После того как тесты в нагиусе прошли удачно и статус алерта стал ОК – РОД должен просто его закрыть. | ||
+ | |||
+ | {{ rod:6.png?700x250 }} | ||
+ | ===== Работа с тикетами ===== | ||
+ | |||
+ | Кнопка открытия Тикета очень проста для пользования – нажимаете, вводите текст – тикет готов. | ||
+ | Тикеты к Алертам создаються только отсюда (из Дашбоарда), не в коем случае из GGUS.(!!!) | ||
+ | |||
+ | {{ rod:5.png?700x250 }} |