Best practices status page: jak komunikować awarie
· 6 min czytania
W skrócie: Publiczna strona statusu to miejsce, gdzie klienci idą, gdy coś im nie działa. Dobra status page redukuje support tickets, buduje zaufanie i ratuje twój zespół od dziesiątek powtarzanych pytań podczas incydentu.
W skrócie: Publiczna strona statusu to miejsce, gdzie klienci idą, gdy coś im nie działa. Dobra status page redukuje support tickets, buduje zaufanie i ratuje twój zespół od dziesiątek powtarzanych pytań podczas incydentu.
Co musi mieć dobra status page
- Aktualny stan każdej kluczowej usługi. Nie tylko "wszystko OK" - podzielone na komponenty (API, web, dashboard, emailing, payment processing).
- Historię incydentów za ostatnie 90 dni. Bez próby ich ukrycia. Uczciwa historia buduje zaufanie.
- Metrykę uptime (typowo za 30 dni) dla każdego komponentu. Przejrzysty procent.
- Planowaną konserwację. Banner z datą i opisem co będzie niedostępne.
- Aktywny incydent z post-update timeline-em. Investigating → Identified → Monitoring → Resolved.
- Formularz subscribe - klienci dostają email przy zmianie stanu, nie muszą wielokrotnie checkować.
Jasna hierarchia komponentów
Zamiast jednego rekordu "monitor" podziel na komponenty, które mają sens z perspektywy klienta:
- Web App - frontend (odwiedzający go używają)
- API - backend dla integracji programowych
- Auth / Login - logowanie
- Email delivery - transactional emaile
- Background jobs - sync, fakturacja, exports
- Status page - sama meta - również ta może paść (dlatego powinna być hostowana na innej infrastrukturze niż produkt)
Komunikacja incydentu: anatomia dobrego update
Podczas prawdziwej awarii śledź te fazy:
- Investigating - "Zidentyfikowaliśmy problem z [komponent]. Zespół bada przyczynę." (do 5 min od detekcji)
- Identified - "Przyczyną jest [krótko]. Pracujemy nad fixem. ETA [czas]." (gdy wiesz co to powoduje)
- Monitoring - "Fix wdrożyliśmy. Śledzimy, czy problem się nie powtarza." (po wdrożeniu rozwiązania)
- Resolved - "Incydent rozwiązany. Czas trwania X minut. Postmortem następuje." (potwierdzona naprawa)
Każda faza dostaje timestamp i update. Po incydencie opublikuj post-mortem (root cause, timeline, co robimy aby się nie powtórzyło).
Reguła: Nigdy nie używaj mglistych fraz typu "experiencing some issues". Klienci chcą konkretu: "Login zawodzi dla ~30% prób. API działa normalnie. Web dostępny tylko w trybie read-only."
Hosting: zasada niezależnej infrastruktury
Status page musi działać na innej infrastrukturze niż monitorowana usługa. Jeśli twój region AWS padnie, twoja status page hostowana na tym samym regionie AWS też padnie - dokładnie wtedy, gdy klienci jej najbardziej potrzebują.
Praktyczne rozwiązania:
- Hosting przez zewnętrzny SaaS (StatusPage.io, ePulz.io, Better Stack, Statuspage)
- Własna statyczna strona na CDN (Cloudflare Pages, Netlify) z endpointem API gdzie indziej
- Worst case: minimalna statyczna strona na Cloudflare z ręcznie aktualizowanym tekstem
Subscribers: e-mail / RSS / webhook
Klienci nie chcą wielokrotnie odświeżać status page. Dobra strona wspiera:
- Email subscribers - w ePulz.io dostępne dla zalogowanych użytkowników z planem płatnym (zbieramy subskrypcje tylko od zweryfikowanych kont, nie od anonimowych odwiedzających)
- RSS / Atom feed - tradycyjny sposób dla tech-savvy users
- Webhook - dla zespołów, które chcą zintegrować z własnym Slack lub PagerDuty
Anti-pattern: ukrywanie problemów
Pokusa jest duża, by oznaczyć awarię jako "degraded" zamiast "down", lub wcale jej nie pokazać. To krótkowzroczne:
- Klienci i tak to zauważą (własny monitoring, support ticket flow, sieci społecznościowe)
- Utrata zaufania, gdy odkryją, że status mówi "OK" podczas oczywistej awarii
- Brak obrazu prawdziwego trendu uptime dla wewnętrznych decyzji
Najlepsza strategia: radykalna przejrzystość. GitLab, Cloudflare, Stripe wszyscy publikują szczegółowe post-mortemy nawet przy żenujących błędach. Społeczność to docenia.
SEO i brand
Status page powinna:
- Być na własnej subdomenie (
status.example.com) lub URL prefiksie - Mieć własny branding (logo, kolory) - klient musi wiedzieć, że jest na twojej stronie
- Być indeksowana w Google (lepsza widoczność przy wyszukiwaniu "[marka] down")
- Linkowana z głównej strony (footer "Status usługi")
Wnioski
Status page nie jest dekoracją. To narzędzie operacyjne, które redukuje koszt supportu podczas incydentu i buduje długoterminowe zaufanie. Inwestycja 1-2 godzin w prawidłową konfigurację zwraca się przy pierwszej większej awarii.
Utwórz status page w 5 minut
ePulz.io status pages z własnym brandingiem, email subscribers i incident timeline. 7 dni za darmo.
Wypróbuj ePulz.io za darmo - 7 dni bez karty kredytowej.
Załóż konto