
Коли система виходить з ладу в п’ятницю ввечері, а ІТ-відділ відповідає «ми подивимось у понеділок» — це не просто незручність. Для критичних бізнес-систем кожна година простою — це реальні фінансові втрати, зірвані дедлайни та втрачена довіра.
Що таке SLA і навіщо він потрібен
Service Level Agreement — це формалізована угода про рівень обслуговування, яка визначає: час реакції на інцидент (від 15 хвилин для критичних до 8 годин для низькопріоритетних), час вирішення (від 2 годин до 5 робочих днів), доступність системи (99.5%, 99.9%, 99.95%), графік підтримки (8/5, 12/7, 24/7).
Рівні підтримки
L1 — перша лінія. Прийом звернень, класифікація, вирішення типових проблем за базою знань. Час реакції — 15-30 хвилин.
L2 — друга лінія. Діагностика та вирішення складних технічних проблем. Час реакції — 1-2 години.
L3 — третя лінія. Архітектурні зміни, доробки, рішення проблем на рівні коду. Залучається за ескалацією.
Як обрати правильний SLA
Не всі системи потребують підтримки 24/7. Почніть з класифікації: критичні системи (зупинка бізнесу) — максимальний SLA; важливі (значне зниження ефективності) — стандартний SLA; допоміжні (незручності, але бізнес працює) — базовий SLA.
Метрики та звітність
SLA без вимірювання — це просто папір. Ключові метрики: MTTR (Mean Time to Repair) — середній час відновлення, MTBF (Mean Time Between Failures) — середній час між збоями, відсоток виконання SLA за період, кількість ескалацій.
Ці метрики мають бути прозорими для замовника — щомісячний звіт з аналізом трендів та планом покращення.