Powrót do bloga

Best practices status page: jak komunikować awarie

· 6 min czytania

W skrócie: Publiczna strona statusu to miejsce, gdzie klienci idą, gdy coś im nie działa. Dobra status page redukuje support tickets, buduje zaufanie i ratuje twój zespół od dziesiątek powtarzanych pytań podczas incydentu.

W skrócie: Publiczna strona statusu to miejsce, gdzie klienci idą, gdy coś im nie działa. Dobra status page redukuje support tickets, buduje zaufanie i ratuje twój zespół od dziesiątek powtarzanych pytań podczas incydentu.

Co musi mieć dobra status page

  1. Aktualny stan każdej kluczowej usługi. Nie tylko "wszystko OK" - podzielone na komponenty (API, web, dashboard, emailing, payment processing).
  2. Historię incydentów za ostatnie 90 dni. Bez próby ich ukrycia. Uczciwa historia buduje zaufanie.
  3. Metrykę uptime (typowo za 30 dni) dla każdego komponentu. Przejrzysty procent.
  4. Planowaną konserwację. Banner z datą i opisem co będzie niedostępne.
  5. Aktywny incydent z post-update timeline-em. Investigating → Identified → Monitoring → Resolved.
  6. Formularz subscribe - klienci dostają email przy zmianie stanu, nie muszą wielokrotnie checkować.

Jasna hierarchia komponentów

Zamiast jednego rekordu "monitor" podziel na komponenty, które mają sens z perspektywy klienta:

  • Web App - frontend (odwiedzający go używają)
  • API - backend dla integracji programowych
  • Auth / Login - logowanie
  • Email delivery - transactional emaile
  • Background jobs - sync, fakturacja, exports
  • Status page - sama meta - również ta może paść (dlatego powinna być hostowana na innej infrastrukturze niż produkt)

Komunikacja incydentu: anatomia dobrego update

Podczas prawdziwej awarii śledź te fazy:

  1. Investigating - "Zidentyfikowaliśmy problem z [komponent]. Zespół bada przyczynę." (do 5 min od detekcji)
  2. Identified - "Przyczyną jest [krótko]. Pracujemy nad fixem. ETA [czas]." (gdy wiesz co to powoduje)
  3. Monitoring - "Fix wdrożyliśmy. Śledzimy, czy problem się nie powtarza." (po wdrożeniu rozwiązania)
  4. Resolved - "Incydent rozwiązany. Czas trwania X minut. Postmortem następuje." (potwierdzona naprawa)

Każda faza dostaje timestamp i update. Po incydencie opublikuj post-mortem (root cause, timeline, co robimy aby się nie powtórzyło).

Reguła: Nigdy nie używaj mglistych fraz typu "experiencing some issues". Klienci chcą konkretu: "Login zawodzi dla ~30% prób. API działa normalnie. Web dostępny tylko w trybie read-only."

Hosting: zasada niezależnej infrastruktury

Status page musi działać na innej infrastrukturze niż monitorowana usługa. Jeśli twój region AWS padnie, twoja status page hostowana na tym samym regionie AWS też padnie - dokładnie wtedy, gdy klienci jej najbardziej potrzebują.

Praktyczne rozwiązania:

  • Hosting przez zewnętrzny SaaS (StatusPage.io, ePulz.io, Better Stack, Statuspage)
  • Własna statyczna strona na CDN (Cloudflare Pages, Netlify) z endpointem API gdzie indziej
  • Worst case: minimalna statyczna strona na Cloudflare z ręcznie aktualizowanym tekstem

Subscribers: e-mail / RSS / webhook

Klienci nie chcą wielokrotnie odświeżać status page. Dobra strona wspiera:

  • Email subscribers - w ePulz.io dostępne dla zalogowanych użytkowników z planem płatnym (zbieramy subskrypcje tylko od zweryfikowanych kont, nie od anonimowych odwiedzających)
  • RSS / Atom feed - tradycyjny sposób dla tech-savvy users
  • Webhook - dla zespołów, które chcą zintegrować z własnym Slack lub PagerDuty

Anti-pattern: ukrywanie problemów

Pokusa jest duża, by oznaczyć awarię jako "degraded" zamiast "down", lub wcale jej nie pokazać. To krótkowzroczne:

  • Klienci i tak to zauważą (własny monitoring, support ticket flow, sieci społecznościowe)
  • Utrata zaufania, gdy odkryją, że status mówi "OK" podczas oczywistej awarii
  • Brak obrazu prawdziwego trendu uptime dla wewnętrznych decyzji

Najlepsza strategia: radykalna przejrzystość. GitLab, Cloudflare, Stripe wszyscy publikują szczegółowe post-mortemy nawet przy żenujących błędach. Społeczność to docenia.

SEO i brand

Status page powinna:

  • Być na własnej subdomenie (status.example.com) lub URL prefiksie
  • Mieć własny branding (logo, kolory) - klient musi wiedzieć, że jest na twojej stronie
  • Być indeksowana w Google (lepsza widoczność przy wyszukiwaniu "[marka] down")
  • Linkowana z głównej strony (footer "Status usługi")

Wnioski

Status page nie jest dekoracją. To narzędzie operacyjne, które redukuje koszt supportu podczas incydentu i buduje długoterminowe zaufanie. Inwestycja 1-2 godzin w prawidłową konfigurację zwraca się przy pierwszej większej awarii.

Utwórz status page w 5 minut

ePulz.io status pages z własnym brandingiem, email subscribers i incident timeline. 7 dni za darmo.

Spróbować ePulz.io →


Wypróbuj ePulz.io za darmo - 7 dni bez karty kredytowej.

Załóż konto