Зміст

Сертифікація ресурсного центру

Першоджерело цього документу – процедура реєстрації та сертифікації ресурсних центрів EGI: PROC09, MAN01.

Вимоги

  1. Сертифікація дозволена лише для ресурсних центрів у стані Candidate чи Suspended.
  2. Ресурсний центр має прийняти умови угоди щодо рівня операційного обслуговування OLA.
  3. Щоб пройти сертифікацію, ресурсний центр має задовольняти умовам OLA.

Процедура сертифікації

Крок Сторона Дії
1 ОЦ Менеджер ОЦ погоджує із менеджером РЦ підписання угоди операційного рівня (OLA)
2 РЦ Менеджер РЦ сповіщає менеджера ОЦ від імені організації про згоду із умовами угоди та готовність до сертифікації
3 ОЦ Змінити статус РЦ на Uncertified. У випадку якщо РЦ було призупинено (стан Suspended), перевірити чи було усунено причину зупинки.
4 ОЦ Перевірити функціональність та коректність відомостей у інформаційній системі РЦ:
- приналежність РЦ до NGI_UA (GlueSiteOtherInfo згідно MAN01)
- всі сервіси РЦ, що вимагаютья OLA, вірно зареєстровані у GOCDB
- службові ВО ops та dteam сконфігуровані та підтримуються на РЦ
- регіональні ВО ung.infrastructure та UATest сконфігуровані та підтримуються на РЦ
- РЦ підключено до регіональної служби обліку (Accounting)
Інструкції з перевірки інформаційної системи РЦ описані у HOWTO03
5 ОЦ Перевірити, що зареєстровані у GOCDB сервіси повністю функціонують шляхом ручних тестів. У випадку проблем зв'язатись із адміністраторами РЦ, за необхідності залучити експертів служби підтримки. Провести декілька ітерацій доки усі помилки не буде виправлено. Основні тести для перевірки:
- мережева доступність
- запуск завдання на CE
- завантаження файлу на SE
Інструкції із запуску ручних тестів наведені у HOWTO04
Як альтернатива ручним тестам, можна додати несертифікований РЦ до регіонального моніторингу Nagios (SAM)
На період тестування РЦ має використовувати спеціальні каталоги ресурсів для несертифікованих сайтів (Top-BDII iiu.ha.grid.org.ua)
6 ОЦ Якщо протягом 3 (трьох) днів не було виявлено помилок у роботі сервісів РЦ, встановити стан у Certified та перевести РЦ у початковий Downtime. Дочекатись появи РЦ в усіх операційних засобах EGI:
- регіональний Nagios (усі тести мають проходити успішно)
- Operations Dashboard
- GStat (не має містити стан ERROR)
- MyEGI та MyWLCG
Якщо за 2 (два) дні РЦ не з'явився у якомусь із операційних засобів, створити відповідні тікети у GGUS.
7 ОЦ Припинити початковий Downtime та сповістити РЦ та команду ROD про успішну сертифікацію.