Best practices de status page: como comunicar quedas
· 6 min de leitura
Em resumo: Uma página de estado pública é o local onde os clientes vão quando algo não lhes funciona. Uma boa status page reduz tickets de suporte, constrói confiança e salva a tua equipa de dezenas de perguntas repetidas durante um incidente.
Em resumo: Uma página de estado pública é o local onde os clientes vão quando algo não lhes funciona. Uma boa status page reduz tickets de suporte, constrói confiança e salva a tua equipa de dezenas de perguntas repetidas durante um incidente.
O que uma boa status page deve ter
- Estado atual de cada serviço chave. Não apenas "tudo OK" - dividido por componentes (API, web, dashboard, emailing, payment processing).
- Histórico de incidentes dos últimos 90 dias. Sem tentar escondê-los. História honesta constrói confiança.
- Métrica de uptime (tipicamente em 30 dias) para cada componente. Percentagem transparente.
- Manutenção planeada. Banner com data e descrição do que será inaccessible.
- Incidente ativo com timeline post-update. Investigating → Identified → Monitoring → Resolved.
- Formulário subscribe - clientes recebem email com mudança de estado, não têm de verificar repetidamente.
Hierarquia clara de componentes
Em vez de um único registo "monitor" divide em componentes que fazem sentido da perspetiva do cliente:
- Web App - frontend (os visitantes usam-no)
- API - backend para integrações programáticas
- Auth / Login - login
- Email delivery - emails transacionais
- Background jobs - sync, faturação, exports
- Status page - meta em si - até esta pode cair (por isso deveria estar hospedada em infraestrutura diferente do produto)
Comunicação de incidente: anatomia de bom update
Durante uma queda real segue estas fases:
- Investigating - "Identificámos um problema com [componente]. A equipa investiga a causa." (dentro de 5 min da deteção)
- Identified - "A causa é [brevemente]. Estamos a trabalhar no fix. ETA [tempo]." (quando sabes o que causa)
- Monitoring - "Implementámos o fix. Monitorizamos se o problema não se repete." (após implementação da solução)
- Resolved - "O incidente está resolvido. Duração X minutos. Postmortem segue." (recuperação confirmada)
Cada fase recebe timestamp e update. Após o incidente publica um post-mortem (root cause, timeline, o que fazemos para que não se repita).
Regra: Nunca uses frases vagas como "experiencing some issues". Os clientes querem concretude: "Login falha para ~30% das tentativas. API funciona normalmente. Web disponível apenas em modo read-only."
Hosting: princípio de infraestrutura independente
A status page tem de correr em infraestrutura diferente do serviço monitorizado. Se a tua região AWS cai, a tua status page hospedada na mesma região AWS também cai - exatamente quando os clientes mais precisam dela.
Soluções práticas:
- Hosting via SaaS externo (StatusPage.io, ePulz.io, Better Stack, Statuspage)
- Própria página estática em CDN (Cloudflare Pages, Netlify) com endpoint API noutro lado
- Worst case: página estática mínima em Cloudflare com texto atualizado manualmente
Subscribers: e-mail / RSS / webhook
Os clientes não querem fazer refresh repetidamente da status page. Uma boa página suporta:
- Email subscribers - em ePulz.io disponível para utilizadores logados com plano pago (recolhemos subscrições apenas de contas verificadas, não de visitantes anónimos)
- RSS / Atom feed - modo tradicional para tech-savvy users
- Webhook - para equipas que querem integrar no seu Slack ou PagerDuty
Anti-pattern: esconder problemas
A tentação é grande de marcar uma queda como "degraded" em vez de "down", ou não a mostrar de todo. Isso é míope:
- Os clientes vão notar de qualquer forma (monitorização própria, flow de support ticket, redes sociais)
- Perda de confiança quando descobrem que o status diz "OK" durante uma queda evidente
- Nenhuma imagem do trend uptime real para tomada de decisão interna
Melhor estratégia: transparência radical. GitLab, Cloudflare, Stripe publicam todos post-mortems detalhados mesmo por erros embaraçosos. A comunidade aprecia.
SEO e brand
A status page deveria:
- Estar em próprio subdomínio (
status.example.com) ou prefixo URL - Ter próprio branding (logo, cores) - o cliente tem de saber que está na tua página
- Ser indexada no Google (melhor visibilidade na pesquisa "[brand] down")
- Linkada da página principal (footer "Estado do serviço")
Conclusão
A status page não é decoração. É uma ferramenta operativa que reduz o custo de suporte durante um incidente e constrói confiança a longo prazo. O investimento de 1-2 horas em configuração correta retorna na primeira queda maior.
Cria uma status page em 5 minutos
ePulz.io status pages com próprio branding, email subscribers e incident timeline. 7 dias grátis.
Experimente o ePulz.io grátis - 7 dias sem cartão de crédito.
Criar conta