Что такое uptime и почему он важен
· 5 мин чтения
Кратко: Uptime - это процент времени, когда ваш сайт доступен. 99 % звучит много, но на практике это означает более трёх дней простоя в год. Для сайтов и приложений, приносящих оборот, реалистичная цель - не менее 99,9 % (8,7 часа простоя в год) - и ключ в том, чтобы узнать о проблеме в течение минуты.
Кратко: Uptime - это процент времени, когда ваш сайт доступен. 99 % звучит много, но на практике это означает более трёх дней простоя в год. Для сайтов и приложений, приносящих оборот, реалистичная цель - не менее 99,9 % (8,7 часа простоя в год) - и ключ в том, чтобы узнать о проблеме в течение минуты.
Определение: что именно мы измеряем
Uptime - это отношение времени, когда сервис отвечает ожидаемо (обычно HTTP 200, контент содержит ключевое слово), к общему времени измерения. Выражается в процентах, чаще всего за период 30 или 365 дней.
Противоположное - downtime - время, когда сервис не отвечает, возвращает 5xx или превышает заданный timeout. Сюда же входит плановое обслуживание, если вы явно не исключите его из расчёта (что следует указать в SLA).
Таблица «девяток»: сколько времени означает каждый знак
| Uptime | Допустимый downtime / год | Месяц | День |
|---|---|---|---|
| 99 % | 3 дня 15 ч | 7 ч 18 мин | 14 мин |
| 99,5 % | 1 день 19 ч | 3 ч 39 мин | 7 мин |
| 99,9 % (three nines) | 8 ч 45 мин | 43 мин | 1 мин 26 с |
| 99,95 % | 4 ч 22 мин | 21 мин | 43 с |
| 99,99 % (four nines) | 52 мин | 4 мин 22 с | 8,6 с |
| 99,999 % (five nines) | 5 мин 15 с | 26 с | 0,86 с |
Каждая дополнительная девятка множит затраты на инфраструктуру. Five nines (99,999 %) - это домен глобальных провайдеров с активной межконтинентальной избыточностью - для большинства бизнес-приложений 99,9 % - правильная цель.
Какой uptime вам действительно нужен
- Маркетинговый сайт (компания, портфолио): 99 % хватит. Посетитель, пришедший во время простоя, попробует позже.
- SaaS-приложение с desktop-клиентом: 99,9 % - минимум. Клиенты платят за работу, которую не могут делать во время downtime.
- Интернет-магазин, платёжный шлюз, real-time сервис: 99,95 % и выше. Каждая минута = прямые убытки.
- Инфраструктура (API, используемое другими): Не менее 99,99 %. Ваш SLA ограничивает SLA клиентов.
Как измеряется uptime
Служба мониторинга периодически вызывает ваш endpoint (обычно HTTP GET, но также TCP socket, ICMP ping или DNS resolution). У каждой проверки бинарный результат: up или down.
Обычный интервал - 1-5 минут. Чем короче, тем быстрее поймаете сбой, но тем больше false-positive алертов получите (локальный network glitch, короткий рестарт деплоя). Решение - multi-region проверка: сбой подтверждается только когда о нём сообщают N регионов, а не один.
Самые частые источники «потерянных девяток»
- Просроченный SSL/TLS сертификат. Браузер блокирует страницу. Без мониторинга вы узнаете об этом в понедельник утром, когда зазвонит телефон.
- Истечение домена. Весь DNS перестаёт работать. Email, сайт, status page - всё падает одновременно.
- Упавший database worker. Сайт возвращает 500 или timeout для части запросов. Классический ping может даже пройти.
- DDoS или флудинг. Сервер перегружен, response time выходит за лимит, мониторинг сообщает о сбое.
- Неудачный деплой. Новая версия содержит баг, ломающий путь. Без integration тестов вы узнаете, когда клиенты начнут жаловаться.
Вывод
Uptime - не маркетинговая цифра, это мера того, насколько вы можете полагаться на собственную инфраструктуру. 99,9 % uptime - не роскошь, а стандартное требование для любого сервиса, генерирующего оборот или имеющего платящих клиентов.
Шаг один - измерять. Если у вас нет внешнего мониторинга, технически вы не знаете, какой у вас uptime - вы только предполагаете.
Начните измерять uptime своих сервисов
ePulz.io отслеживает ваши endpoint'ы с интервалами от 1 минуты из нескольких регионов. 7 дней бесплатно.
Попробуйте ePulz.io бесплатно - 7 дней без банковской карты.
Создать аккаунт