Zpět na blog

Best practices status page: jak komunikovat výpadky

· 6 min čtení

Ve zkratce: Public status stránka je místo, kam jdou zákazníci, když jim něco nefunguje. Dobrá status page snižuje support tickets, buduje důvěru a zachraňuje váš tým od desítek opakovaných otázek během incidentu.

Ve zkratce: Public status stránka je místo, kam jdou zákazníci, když jim něco nefunguje. Dobrá status page snižuje support tickets, buduje důvěru a zachraňuje váš tým od desítek opakovaných otázek během incidentu.

Co musí mít dobrá status page

  1. Aktuální stav každé klíčové služby. Ne jen "všechno OK" - rozdělené po komponentech (API, web, dashboard, emailing, payment processing).
  2. Historii incidentů za posledních 90 dní. Bez snahy je skrývat. Honest history buduje důvěru.
  3. Uptime metriku (typicky za 30 dní) pro každý komponent. Transparentní procento.
  4. Plánovanou údržbu. Banner s datem a popisem co bude inaccessible.
  5. Aktivní incident s post-update timeline-em. Investigating → Identified → Monitoring → Resolved.
  6. Subscribe formulář - zákazníci dostanou email při změně stavu, nemusí opakovaně checkovat.

Jasná hierarchie komponent

Místo jednoho "monitor" záznamu rozdělte na komponenty, které dávají smysl z perspektivy zákazníka:

  • Web App - frontend (návštěvníci ho používají)
  • API - backend pro programové integrace
  • Auth / Login - přihlašování
  • Email delivery - transactional emaily
  • Background jobs - sync, fakturace, exports
  • Status page - sama meta - i tato může padnout (proto by měla být hostovaná na jiné infrastruktuře než produkt)

Incident komunikace: anatomie dobrého update

Při reálném výpadku sledujte tyto fáze:

  1. Investigating - "Identifikovali jsme problém s [komponent]. Tým zkoumá příčinu." (do 5 min od detekce)
  2. Identified - "Příčinou je [stručně]. Pracujeme na fixu. ETA [čas]." (když víte co to způsobuje)
  3. Monitoring - "Fix jsme nasadili. Sledujeme, zda se problém neopakuje." (po nasazení řešení)
  4. Resolved - "Incident je vyřešen. Trvání X minut. Postmortem následuje." (potvrzená obnova)

Každá fáze dostává timestamp a update. Po incidentu publikujte post-mortem (root cause, timeline, co děláme aby se to neopakovalo).

Pravidlo: Nikdy nepoužívejte vágní fráze "experiencing some issues". Zákazníci chtějí konkrétnost: "Login selhává pro ~30% pokusů. API funguje normálně. Web je dostupný jen v read-only módu."

Hosting: zásada nezávislé infrastruktury

Status page musí běžet na jiné infrastruktuře než monitorovaná služba. Pokud váš AWS region padne, vaše status page hostovaná na tom stejném AWS regionu také padne - přesně v moment, kdy ji zákazníci nejvíc potřebují.

Praktická řešení:

  • Hostování přes externí SaaS (StatusPage.io, ePulz.io, Better Stack, Statuspage)
  • Vlastní static stránka na CDN (Cloudflare Pages, Netlify) s API endpointem jinde
  • Worst case: minimální statická stránka na Cloudflare s manuálně updatovaným textem

Subscribers: e-mail / RSS / webhook

Zákazníci nechtějí opakovaně refreshovat status page. Dobrá stránka podporuje:

  • Email subscribers - v ePulz.io dostupné pro přihlášené uživatele s placeným plánem (sbíráme odběry jen od ověřených účtů, ne od anonymních návštěvníků)
  • RSS / Atom feed - tradiční způsob pro tech-savvy users
  • Webhook - pro týmy, které chtějí integrovat do svého Slack nebo PagerDuty

Anti-pattern: skrývání problémů

Pokušení je velké označit výpadek jako "degraded" místo "down", nebo ho vůbec neukázat. To je krátkozraké:

  • Zákazníci ho stejně zaregistrují (vlastní monitoring, support ticket flow, sociální sítě)
  • Ztráta důvěry, když zjistí, že status říká "OK" během evidentního výpadku
  • Žádný obraz reálného uptime trendu pro interní rozhodování

Nejlepší strategie: radikální transparentnost. GitLab, Cloudflare, Stripe všechny publikují detailní post-mortem i při trapných chybách. Komunita to oceňuje.

SEO a brand

Status stránka by měla:

  • Být na vlastní subdoméně (status.example.com) nebo URL prefixu
  • Mít vlastní branding (logo, barvy) - zákazník musí vědět, že je na vaší stránce
  • Být indexovaná v Google (lepší visibility při "[brand] down" search)
  • Linkovaná z hlavní stránky (footer "Status služby")

Závěr

Status page není dekorace. Je to operativní nástroj, který snižuje support cost během incidentu a buduje dlouhodobou důvěru. Investice 1-2 hodiny do správné konfigurace se vrátí při prvním větším výpadku.

Vytvořte status page za 5 minut

ePulz.io status pages s vlastním brandingem, email subscribers a incident timeline. 7 dní zdarma.

Zkusit ePulz.io →


Vyzkoušejte ePulz.io zdarma - 7 dní bez kreditní karty.

Vytvořit účet