Blog ePulz.io

2026-05-23 · 7 min

Monitorização de dispositivos na rede interna do cliente via agente LAN

A monitorização cloud não alcança NAS, câmaras nem servidores locais por trás do router do cliente. O agente LAN ePulz.io inverte o sentido da comunicação - um pequeno daemon na sua rede chama-nos via HTTPS comum. Sem port forwards, sem VPN.

2026-05-21 · 4 min

Porquê monitorizar o site (e quanto custa quando não o faz)

Uma quebra do e-shop de 1 h em horário de pico = centenas de € em encomendas perdidas. Expiração de SSL = 100 % de perda de tráfego. Calculámos os custos reais.

2025-12-03 · 6 min

Webhook, e-mail ou Telegram: qual alerta usar e quando

O e-mail é lento mas auditável, o Telegram rápido mas informal, o webhook flexível mas exige integração. Guia prático para combinar canais sem alert fatigue.

2025-09-11 · 8 min

Playbook de incident response para equipas pequenas

Funções, níveis de severidade, os primeiros 15 minutos de um incidente SEV1, estrutura de post-mortem. Guia prático para uma equipa de 5-20 pessoas sem SRE dedicado.

2025-05-19 · 7 min

SLI, SLO, SLA: medimos a disponibilidade sem ilusões

Três termos do livro Google SRE que costumam ser confundidos. SLI é uma métrica, SLO um objetivo interno, SLA um contrato. Mais o conceito de error budget na prática.

2025-04-15 · 7 min

Monitorização de API: quando HTTP 200 não chega

Um backend pode devolver 200 OK com corpo 'status: error'. A verdadeira monitorização de API combina status code, keyword match no conteúdo, asserções JSONPath e response time.

2025-02-25 · 6 min

Core Web Vitals e uptime: quando 200 OK não chega ao Google

LCP, INP, CLS - três métricas de UX real que o Google usa como ranking factor. Um servidor pode estar a 100 % de uptime e mesmo assim perder posição por causa de um LCP lento.

2024-12-18 · 6 min

Como é uma boa página pública de estado

Componentes, incident timeline, post-mortem, subscribers, hosting em infraestrutura independente. Anti-pattern: esconder os problemas.

2024-10-04 · 6 min

Como eliminar as quebras falsos positivos na monitorização

A monitorização single-region mente. O cross-check multi-region com algoritmo de consenso (M em N sondas) reduz drasticamente o ruído e protege contra alert fatigue.

2024-07-30 · 7 min

Cabeçalhos HTTP de segurança: HSTS, CSP, X-Frame-Options e outros

Configuração prática de security headers em nginx. HSTS preload, CSP com nonce/hash, Permissions-Policy. Meia hora de trabalho para uma defesa completa do lado do browser.

2024-05-12 · 7 min

Troubleshooting de DNS: nslookup, dig e DNS-over-HTTPS

Procedimentos práticos de debugging DNS. dig +trace, +dnssec, RDAP API, DoH para contornar a porta 53 bloqueada. Mais checklist para 'o domínio não funciona'.

2024-04-08 · 6 min

Expiração de domínio: monitorização WHOIS na prática

Expiração do domínio = quebra simultânea do site, do e-mail e de todos os subdomínios. Grace period para diferentes TLDs, porque o auto-renewal falha, como a monitorização avisa 90 dias antes.

2024-02-20 · 6 min

Códigos de estado HTTP: 200, 301, 404, 5xx e o que fazer

Cheat sheet prático dos códigos HTTP 2xx-5xx. Quais alertar de imediato, quais ignorar, quando reagir a uma tendência. Incluindo Cloudflare 5xx (520-525).

2023-11-14 · 6 min

Monitorização de cron jobs: padrão heartbeat na prática

As tarefas background sem endpoint HTTP são o ponto cego da monitorização. O padrão heartbeat inverte o sentido da comunicação - o cron faz ping à monitorização. Implementação em bash, Python, Node.

2023-09-08 · 6 min

O que fazer quando expira um certificado SSL

Procedimento rápido de renovação do Let's Encrypt e de cert comercial, renewal automático via certbot, Caddy/Traefik com ACME, monitorização de expiração como safety net.

2023-06-15 · 5 min

O que é uptime e porque importa

Tabela de nines em percentagem (99 % = 3,65 dias, 99,9 % = 8,76 h, 99,99 % = 52 min por ano). Que uptime precisa consoante o tipo de produto. As fontes mais comuns de nines perdidos.