Назад до блогу

Що таке uptime і чому він важливий

· 5 хв читання

Коротко: Uptime - це відсоток часу, коли ваш сайт доступний. 99 % звучить багато, але на практиці це означає понад три дні простою на рік. Для сайтів і додатків, що приносять оборот, реалістична ціль - щонайменше 99,9 % (8,7 години простою на рік) - і ключ у тому, щоб дізнатися про проблему протягом хвилини.

Коротко: Uptime - це відсоток часу, коли ваш сайт доступний. 99 % звучить багато, але на практиці це означає понад три дні простою на рік. Для сайтів і додатків, що приносять оборот, реалістична ціль - щонайменше 99,9 % (8,7 години простою на рік) - і ключ у тому, щоб дізнатися про проблему протягом хвилини.

Визначення: що саме ми вимірюємо

Uptime - це відношення часу, коли сервіс відповідає очікувано (зазвичай HTTP 200, контент містить ключове слово), до загального часу вимірювання. Виражається у відсотках, найчастіше за період 30 або 365 днів.

Протилежне - downtime - час, коли сервіс не відповідає, повертає 5xx або перевищує заданий timeout. Сюди ж входить планове обслуговування, якщо ви явно не виключите його з розрахунку (що слід вказати в SLA).

Таблиця «дев'яток»: скільки часу означає кожен знак

Uptime Допустимий downtime / рік Місяць День
99 % 3 дні 15 год 7 год 18 хв 14 хв
99,5 % 1 день 19 год 3 год 39 хв 7 хв
99,9 % (three nines) 8 год 45 хв 43 хв 1 хв 26 с
99,95 % 4 год 22 хв 21 хв 43 с
99,99 % (four nines) 52 хв 4 хв 22 с 8,6 с
99,999 % (five nines) 5 хв 15 с 26 с 0,86 с

Кожна додаткова дев'ятка множить витрати на інфраструктуру. Five nines (99,999 %) - це домен глобальних провайдерів з активною міжконтинентальною надлишковістю - для більшості бізнес-додатків 99,9 % - правильна ціль.

Який uptime вам справді потрібен

  • Маркетинговий сайт (компанія, портфоліо): 99 % вистачить. Відвідувач, що прийшов під час простою, спробує пізніше.
  • SaaS-додаток з desktop-клієнтом: 99,9 % - мінімум. Клієнти платять за роботу, яку не можуть робити під час downtime.
  • Інтернет-магазин, платіжний шлюз, real-time сервіс: 99,95 % і вище. Кожна хвилина = прямі збитки.
  • Інфраструктура (API, яке використовують інші): Щонайменше 99,99 %. Ваш SLA обмежує SLA клієнтів.

Як вимірюється uptime

Служба моніторингу періодично викликає ваш endpoint (зазвичай HTTP GET, але також TCP socket, ICMP ping або DNS resolution). Кожна перевірка має бінарний результат: up або down.

Звичайний інтервал - 1-5 хвилин. Чим коротший, тим швидше зловите збій, але тим більше false-positive алертів отримаєте (локальний network glitch, короткий рестарт деплою). Рішення - multi-region перевірка: збій підтверджується тільки коли про нього повідомляють N регіонів, а не один.

Найчастіші джерела «втрачених дев'яток»

  1. Прострочений SSL/TLS сертифікат. Браузер блокує сторінку. Без моніторингу ви дізнаєтеся про це в понеділок вранці, коли задзвонить телефон.
  2. Закінчення домену. Весь DNS перестає працювати. Email, сайт, status page - все падає одночасно.
  3. Упалий database worker. Сайт повертає 500 або timeout для частини запитів. Класичний ping може навіть пройти.
  4. DDoS або флудинг. Сервер перевантажений, response time виходить за ліміт, моніторинг повідомляє про збій.
  5. Невдалий деплой. Нова версія містить баг, що ламає шлях. Без integration тестів ви дізнаєтеся, коли клієнти почнуть скаржитися.

Висновок

Uptime - не маркетингова цифра, це міра того, наскільки ви можете покластися на власну інфраструктуру. 99,9 % uptime - не розкіш, а стандартна вимога для будь-якого сервісу, що генерує оборот або має платних клієнтів.

Крок один - вимірювати. Якщо у вас немає зовнішнього моніторингу, технічно ви не знаєте, який у вас uptime - ви тільки припускаєте.

Почніть вимірювати uptime своїх сервісів

ePulz.io відстежує ваші endpoint'и з інтервалами від 1 хвилини з кількох регіонів. 7 днів безкоштовно.

Запустити моніторинг →


Спробуйте ePulz.io безкоштовно - 7 днів без банківської картки.

Створити акаунт