Блог ePulz.io

Практические статьи об uptime, SSL, DNS, стратегии мониторинга и инфраструктуре.

2026-05-23 · 7 мин

Мониторинг устройств во внутренней сети клиента через LAN-агент

Облачный мониторинг не дотянется до NAS, камер и локальных серверов за роутером клиента. LAN-агент ePulz.io переворачивает направление коммуникации - небольшой демон в вашей сети вызывает нас по обычному HTTPS. Никаких port forward, никакого VPN.
2026-05-21 · 4 мин

Зачем мониторить сайт (и сколько вам стоит, когда вы этого не делаете)

Простой интернет-магазина 1 ч в пик = сотни € упущенных заказов. Истечение SSL = 100% потеря трафика. Мы посчитали реальные затраты.
2025-12-03 · 6 мин

Webhook, e-mail или Telegram: какой алерт когда использовать

E-mail медленный, но аудируемый, Telegram быстрый, но неформальный, webhook гибкий, но требует интеграции. Практическое руководство как комбинировать каналы без alert fatigue.
2025-09-11 · 8 мин

Incident response playbook для малых команд

Роли, уровни severity, первые 15 минут SEV1-инцидента, структура post-mortem. Практическое руководство для команды 5-20 человек без выделенного SRE.
2025-05-19 · 7 мин

SLI, SLO, SLA: измеряем доступность без иллюзий

Три понятия из книги Google SRE, которые часто путают. SLI - это метрика, SLO - внутренняя цель, SLA - договор. Плюс концепция error budget на практике.
2025-04-15 · 7 мин

Мониторинг API: когда HTTP 200 недостаточно

Бэкенд может возвращать 200 OK с телом 'status: error'. Настоящий мониторинг API комбинирует код статуса, keyword match в содержимом, JSONPath-ассерции и response time.
2025-02-25 · 6 мин

Core Web Vitals и uptime: когда 200 OK недостаточно для Google

LCP, INP, CLS - три метрики реального UX, которые Google использует как ranking factor. Сервер может иметь 100% uptime и всё равно потерять позиции из-за медленного LCP.
2024-12-18 · 6 мин

Как выглядит хорошая публичная status-страница

Компоненты, incident timeline, post-mortem, subscribers, хостинг на независимой инфраструктуре. Анти-паттерн: скрывать проблемы.
2024-10-04 · 6 мин

Как устранить false-positive падения в мониторинге

Single-region мониторинг врёт. Multi-region cross-check с алгоритмом консенсуса (M из N зондов) резко снижает шум и защищает от alert fatigue.
2024-07-30 · 7 мин

HTTP security-заголовки: HSTS, CSP, X-Frame-Options и другие

Практическая настройка security-заголовков в nginx. HSTS preload, CSP с nonce/hash, Permissions-Policy. Полчаса работы для полной защиты на стороне браузера.
2024-05-12 · 7 мин

DNS troubleshooting: nslookup, dig и DNS-over-HTTPS

Практические процедуры DNS-дебага. dig +trace, +dnssec, RDAP API, DoH для обхода заблокированного порта 53. Плюс чек-лист на случай 'домен не работает'.
2024-04-08 · 6 мин

Истечение домена: WHOIS-мониторинг на практике

Истечение домена = одновременное падение сайта, e-mail и всех поддоменов. Grace period для разных TLD, почему auto-renewal не срабатывает, как мониторинг предупредит за 90 дней.
2024-02-20 · 6 мин

HTTP коды статуса: 200, 301, 404, 5xx и что с ними делать

Практическая шпаргалка HTTP кодов 2xx-5xx. Какие алертить немедленно, какие игнорировать, когда реагировать на тренд. Включая Cloudflare 5xx (520-525).
2023-11-14 · 6 мин

Мониторинг cron-задач: heartbeat-паттерн на практике

Background-задачи без HTTP-эндпоинта - слепое пятно мониторинга. Heartbeat-паттерн переворачивает направление коммуникации - cron пингует мониторинг. Реализация в bash, Python, Node.
2023-09-08 · 6 мин

Что делать, когда истекает SSL-сертификат

Быстрая процедура обновления Let's Encrypt и коммерческого сертификата, автоматический renewal через certbot, Caddy/Traefik с ACME, мониторинг истечения как safety net.
2023-06-15 · 5 мин

Что такое uptime и почему он важен

Таблица процентных nines (99% = 3,65 дня, 99,9% = 8,76 ч, 99,99% = 52 мин в год). Какой uptime нужен в зависимости от типа продукта. Самые частые источники потерянных nines.

Блог ePulz.io

Мониторинг устройств во внутренней сети клиента через LAN-агент

Зачем мониторить сайт (и сколько вам стоит, когда вы этого не делаете)

Webhook, e-mail или Telegram: какой алерт когда использовать

Incident response playbook для малых команд

SLI, SLO, SLA: измеряем доступность без иллюзий

Мониторинг API: когда HTTP 200 недостаточно

Core Web Vitals и uptime: когда 200 OK недостаточно для Google

Как выглядит хорошая публичная status-страница

Как устранить false-positive падения в мониторинге

HTTP security-заголовки: HSTS, CSP, X-Frame-Options и другие

DNS troubleshooting: nslookup, dig и DNS-over-HTTPS

Истечение домена: WHOIS-мониторинг на практике

HTTP коды статуса: 200, 301, 404, 5xx и что с ними делать

Мониторинг cron-задач: heartbeat-паттерн на практике

Что делать, когда истекает SSL-сертификат

Что такое uptime и почему он важен