Назад в блог

Что такое uptime и почему он важен

· 5 мин чтения

Кратко: Uptime - это процент времени, когда ваш сайт доступен. 99 % звучит много, но на практике это означает более трёх дней простоя в год. Для сайтов и приложений, приносящих оборот, реалистичная цель - не менее 99,9 % (8,7 часа простоя в год) - и ключ в том, чтобы узнать о проблеме в течение минуты.

Кратко: Uptime - это процент времени, когда ваш сайт доступен. 99 % звучит много, но на практике это означает более трёх дней простоя в год. Для сайтов и приложений, приносящих оборот, реалистичная цель - не менее 99,9 % (8,7 часа простоя в год) - и ключ в том, чтобы узнать о проблеме в течение минуты.

Определение: что именно мы измеряем

Uptime - это отношение времени, когда сервис отвечает ожидаемо (обычно HTTP 200, контент содержит ключевое слово), к общему времени измерения. Выражается в процентах, чаще всего за период 30 или 365 дней.

Противоположное - downtime - время, когда сервис не отвечает, возвращает 5xx или превышает заданный timeout. Сюда же входит плановое обслуживание, если вы явно не исключите его из расчёта (что следует указать в SLA).

Таблица «девяток»: сколько времени означает каждый знак

Uptime Допустимый downtime / год Месяц День
99 % 3 дня 15 ч 7 ч 18 мин 14 мин
99,5 % 1 день 19 ч 3 ч 39 мин 7 мин
99,9 % (three nines) 8 ч 45 мин 43 мин 1 мин 26 с
99,95 % 4 ч 22 мин 21 мин 43 с
99,99 % (four nines) 52 мин 4 мин 22 с 8,6 с
99,999 % (five nines) 5 мин 15 с 26 с 0,86 с

Каждая дополнительная девятка множит затраты на инфраструктуру. Five nines (99,999 %) - это домен глобальных провайдеров с активной межконтинентальной избыточностью - для большинства бизнес-приложений 99,9 % - правильная цель.

Какой uptime вам действительно нужен

  • Маркетинговый сайт (компания, портфолио): 99 % хватит. Посетитель, пришедший во время простоя, попробует позже.
  • SaaS-приложение с desktop-клиентом: 99,9 % - минимум. Клиенты платят за работу, которую не могут делать во время downtime.
  • Интернет-магазин, платёжный шлюз, real-time сервис: 99,95 % и выше. Каждая минута = прямые убытки.
  • Инфраструктура (API, используемое другими): Не менее 99,99 %. Ваш SLA ограничивает SLA клиентов.

Как измеряется uptime

Служба мониторинга периодически вызывает ваш endpoint (обычно HTTP GET, но также TCP socket, ICMP ping или DNS resolution). У каждой проверки бинарный результат: up или down.

Обычный интервал - 1-5 минут. Чем короче, тем быстрее поймаете сбой, но тем больше false-positive алертов получите (локальный network glitch, короткий рестарт деплоя). Решение - multi-region проверка: сбой подтверждается только когда о нём сообщают N регионов, а не один.

Самые частые источники «потерянных девяток»

  1. Просроченный SSL/TLS сертификат. Браузер блокирует страницу. Без мониторинга вы узнаете об этом в понедельник утром, когда зазвонит телефон.
  2. Истечение домена. Весь DNS перестаёт работать. Email, сайт, status page - всё падает одновременно.
  3. Упавший database worker. Сайт возвращает 500 или timeout для части запросов. Классический ping может даже пройти.
  4. DDoS или флудинг. Сервер перегружен, response time выходит за лимит, мониторинг сообщает о сбое.
  5. Неудачный деплой. Новая версия содержит баг, ломающий путь. Без integration тестов вы узнаете, когда клиенты начнут жаловаться.

Вывод

Uptime - не маркетинговая цифра, это мера того, насколько вы можете полагаться на собственную инфраструктуру. 99,9 % uptime - не роскошь, а стандартное требование для любого сервиса, генерирующего оборот или имеющего платящих клиентов.

Шаг один - измерять. Если у вас нет внешнего мониторинга, технически вы не знаете, какой у вас uptime - вы только предполагаете.

Начните измерять uptime своих сервисов

ePulz.io отслеживает ваши endpoint'ы с интервалами от 1 минуты из нескольких регионов. 7 дней бесплатно.

Запустить мониторинг →


Попробуйте ePulz.io бесплатно - 7 дней без банковской карты.

Создать аккаунт