Blog ePulz.io
Artigos práticos sobre uptime, SSL, DNS, estratégia de monitorização e infraestrutura.
-
2026-05-23 · 7 min
Monitorização de dispositivos na rede interna do cliente via agente LAN
A monitorização cloud não alcança NAS, câmaras nem servidores locais por trás do router do cliente. O agente LAN ePulz.io inverte o sentido da comunicação - um pequeno daemon na sua rede chama-nos via HTTPS comum. Sem port forwards, sem VPN.
-
2026-05-21 · 4 min
Porquê monitorizar o site (e quanto custa quando não o faz)
Uma quebra do e-shop de 1 h em horário de pico = centenas de € em encomendas perdidas. Expiração de SSL = 100 % de perda de tráfego. Calculámos os custos reais.
-
2025-12-03 · 6 min
Webhook, e-mail ou Telegram: qual alerta usar e quando
O e-mail é lento mas auditável, o Telegram rápido mas informal, o webhook flexível mas exige integração. Guia prático para combinar canais sem alert fatigue.
-
2025-09-11 · 8 min
Playbook de incident response para equipas pequenas
Funções, níveis de severidade, os primeiros 15 minutos de um incidente SEV1, estrutura de post-mortem. Guia prático para uma equipa de 5-20 pessoas sem SRE dedicado.
-
2025-05-19 · 7 min
SLI, SLO, SLA: medimos a disponibilidade sem ilusões
Três termos do livro Google SRE que costumam ser confundidos. SLI é uma métrica, SLO um objetivo interno, SLA um contrato. Mais o conceito de error budget na prática.
-
2025-04-15 · 7 min
Monitorização de API: quando HTTP 200 não chega
Um backend pode devolver 200 OK com corpo 'status: error'. A verdadeira monitorização de API combina status code, keyword match no conteúdo, asserções JSONPath e response time.
-
2025-02-25 · 6 min
Core Web Vitals e uptime: quando 200 OK não chega ao Google
LCP, INP, CLS - três métricas de UX real que o Google usa como ranking factor. Um servidor pode estar a 100 % de uptime e mesmo assim perder posição por causa de um LCP lento.
-
2024-12-18 · 6 min
Como é uma boa página pública de estado
Componentes, incident timeline, post-mortem, subscribers, hosting em infraestrutura independente. Anti-pattern: esconder os problemas.
-
2024-10-04 · 6 min
Como eliminar as quebras falsos positivos na monitorização
A monitorização single-region mente. O cross-check multi-region com algoritmo de consenso (M em N sondas) reduz drasticamente o ruído e protege contra alert fatigue.
-
2024-07-30 · 7 min
Cabeçalhos HTTP de segurança: HSTS, CSP, X-Frame-Options e outros
Configuração prática de security headers em nginx. HSTS preload, CSP com nonce/hash, Permissions-Policy. Meia hora de trabalho para uma defesa completa do lado do browser.
-
2024-05-12 · 7 min
Troubleshooting de DNS: nslookup, dig e DNS-over-HTTPS
Procedimentos práticos de debugging DNS. dig +trace, +dnssec, RDAP API, DoH para contornar a porta 53 bloqueada. Mais checklist para 'o domínio não funciona'.
-
2024-04-08 · 6 min
Expiração de domínio: monitorização WHOIS na prática
Expiração do domínio = quebra simultânea do site, do e-mail e de todos os subdomínios. Grace period para diferentes TLDs, porque o auto-renewal falha, como a monitorização avisa 90 dias antes.
-
2024-02-20 · 6 min
Códigos de estado HTTP: 200, 301, 404, 5xx e o que fazer
Cheat sheet prático dos códigos HTTP 2xx-5xx. Quais alertar de imediato, quais ignorar, quando reagir a uma tendência. Incluindo Cloudflare 5xx (520-525).
-
2023-11-14 · 6 min
Monitorização de cron jobs: padrão heartbeat na prática
As tarefas background sem endpoint HTTP são o ponto cego da monitorização. O padrão heartbeat inverte o sentido da comunicação - o cron faz ping à monitorização. Implementação em bash, Python, Node.
-
2023-09-08 · 6 min
O que fazer quando expira um certificado SSL
Procedimento rápido de renovação do Let's Encrypt e de cert comercial, renewal automático via certbot, Caddy/Traefik com ACME, monitorização de expiração como safety net.
-
2023-06-15 · 5 min
O que é uptime e porque importa
Tabela de nines em percentagem (99 % = 3,65 dias, 99,9 % = 8,76 h, 99,99 % = 52 min por ano). Que uptime precisa consoante o tipo de produto. As fontes mais comuns de nines perdidos.