Блог ePulz.io
Практические статьи об uptime, SSL, DNS, стратегии мониторинга и инфраструктуре.
-
2026-05-23 · 7 мин
Мониторинг устройств во внутренней сети клиента через LAN-агент
Облачный мониторинг не дотянется до NAS, камер и локальных серверов за роутером клиента. LAN-агент ePulz.io переворачивает направление коммуникации - небольшой демон в вашей сети вызывает нас по обычному HTTPS. Никаких port forward, никакого VPN.
-
2026-05-21 · 4 мин
Зачем мониторить сайт (и сколько вам стоит, когда вы этого не делаете)
Простой интернет-магазина 1 ч в пик = сотни € упущенных заказов. Истечение SSL = 100% потеря трафика. Мы посчитали реальные затраты.
-
2025-12-03 · 6 мин
Webhook, e-mail или Telegram: какой алерт когда использовать
E-mail медленный, но аудируемый, Telegram быстрый, но неформальный, webhook гибкий, но требует интеграции. Практическое руководство как комбинировать каналы без alert fatigue.
-
2025-09-11 · 8 мин
Incident response playbook для малых команд
Роли, уровни severity, первые 15 минут SEV1-инцидента, структура post-mortem. Практическое руководство для команды 5-20 человек без выделенного SRE.
-
2025-05-19 · 7 мин
SLI, SLO, SLA: измеряем доступность без иллюзий
Три понятия из книги Google SRE, которые часто путают. SLI - это метрика, SLO - внутренняя цель, SLA - договор. Плюс концепция error budget на практике.
-
2025-04-15 · 7 мин
Мониторинг API: когда HTTP 200 недостаточно
Бэкенд может возвращать 200 OK с телом 'status: error'. Настоящий мониторинг API комбинирует код статуса, keyword match в содержимом, JSONPath-ассерции и response time.
-
2025-02-25 · 6 мин
Core Web Vitals и uptime: когда 200 OK недостаточно для Google
LCP, INP, CLS - три метрики реального UX, которые Google использует как ranking factor. Сервер может иметь 100% uptime и всё равно потерять позиции из-за медленного LCP.
-
2024-12-18 · 6 мин
Как выглядит хорошая публичная status-страница
Компоненты, incident timeline, post-mortem, subscribers, хостинг на независимой инфраструктуре. Анти-паттерн: скрывать проблемы.
-
2024-10-04 · 6 мин
Как устранить false-positive падения в мониторинге
Single-region мониторинг врёт. Multi-region cross-check с алгоритмом консенсуса (M из N зондов) резко снижает шум и защищает от alert fatigue.
-
2024-07-30 · 7 мин
HTTP security-заголовки: HSTS, CSP, X-Frame-Options и другие
Практическая настройка security-заголовков в nginx. HSTS preload, CSP с nonce/hash, Permissions-Policy. Полчаса работы для полной защиты на стороне браузера.
-
2024-05-12 · 7 мин
DNS troubleshooting: nslookup, dig и DNS-over-HTTPS
Практические процедуры DNS-дебага. dig +trace, +dnssec, RDAP API, DoH для обхода заблокированного порта 53. Плюс чек-лист на случай 'домен не работает'.
-
2024-04-08 · 6 мин
Истечение домена: WHOIS-мониторинг на практике
Истечение домена = одновременное падение сайта, e-mail и всех поддоменов. Grace period для разных TLD, почему auto-renewal не срабатывает, как мониторинг предупредит за 90 дней.
-
2024-02-20 · 6 мин
HTTP коды статуса: 200, 301, 404, 5xx и что с ними делать
Практическая шпаргалка HTTP кодов 2xx-5xx. Какие алертить немедленно, какие игнорировать, когда реагировать на тренд. Включая Cloudflare 5xx (520-525).
-
2023-11-14 · 6 мин
Мониторинг cron-задач: heartbeat-паттерн на практике
Background-задачи без HTTP-эндпоинта - слепое пятно мониторинга. Heartbeat-паттерн переворачивает направление коммуникации - cron пингует мониторинг. Реализация в bash, Python, Node.
-
2023-09-08 · 6 мин
Что делать, когда истекает SSL-сертификат
Быстрая процедура обновления Let's Encrypt и коммерческого сертификата, автоматический renewal через certbot, Caddy/Traefik с ACME, мониторинг истечения как safety net.
-
2023-06-15 · 5 мин
Что такое uptime и почему он важен
Таблица процентных nines (99% = 3,65 дня, 99,9% = 8,76 ч, 99,99% = 52 мин в год). Какой uptime нужен в зависимости от типа продукта. Самые частые источники потерянных nines.