Status Page Best Practices: wie man Ausfälle kommuniziert
· 6 Min. Lesezeit
Kurz gesagt: Eine öffentliche Status Page ist der Ort, an den Kunden gehen, wenn ihnen etwas nicht funktioniert. Eine gute Status Page reduziert Support-Tickets, baut Vertrauen auf und rettet Ihr Team vor Dutzenden wiederholten Fragen während eines Vorfalls.
Kurz gesagt: Eine öffentliche Status Page ist der Ort, an den Kunden gehen, wenn ihnen etwas nicht funktioniert. Eine gute Status Page reduziert Support-Tickets, baut Vertrauen auf und rettet Ihr Team vor Dutzenden wiederholten Fragen während eines Vorfalls.
Was eine gute Status Page haben muss
- Aktueller Stand jedes Schlüsseldienstes. Nicht nur „alles OK" - aufgeteilt nach Komponenten (API, Web, Dashboard, Emailing, Payment Processing).
- Incident-Historie der letzten 90 Tage. Ohne den Versuch, sie zu verstecken. Ehrliche Historie baut Vertrauen auf.
- Uptime-Metrik (typisch über 30 Tage) für jede Komponente. Transparentes Prozent.
- Geplante Wartung. Banner mit Datum und Beschreibung dessen, was unzugänglich sein wird.
- Aktiver Vorfall mit Post-Update-Timeline. Investigating → Identified → Monitoring → Resolved.
- Subscribe-Formular - Kunden erhalten E-Mail bei Zustandsänderung, müssen nicht wiederholt checken.
Klare Komponentenhierarchie
Statt eines „monitor"-Eintrags teilen Sie in Komponenten auf, die aus Kundensicht Sinn ergeben:
- Web App - Frontend (Besucher nutzen es)
- API - Backend für programmatische Integrationen
- Auth / Login - Authentifizierung
- Email Delivery - transaktionale E-Mails
- Background Jobs - Sync, Fakturierung, Exports
- Status Page - selbst Meta - auch diese kann fallen (deshalb sollte sie auf anderer Infrastruktur als das Produkt gehostet sein)
Incident-Kommunikation: Anatomie eines guten Updates
Bei einem echten Ausfall verfolgen Sie diese Phasen:
- Investigating - „Wir haben ein Problem mit [Komponente] identifiziert. Das Team untersucht die Ursache." (innerhalb 5 Min nach Detektion)
- Identified - „Die Ursache ist [kurz]. Wir arbeiten am Fix. ETA [Zeit]." (wenn Sie wissen, was es verursacht)
- Monitoring - „Fix wurde deployed. Wir überwachen, ob das Problem wiederkehrt." (nach Deployment der Lösung)
- Resolved - „Der Vorfall ist gelöst. Dauer X Minuten. Postmortem folgt." (bestätigte Wiederherstellung)
Jede Phase erhält Timestamp und Update. Nach dem Vorfall veröffentlichen Sie ein Post-Mortem (Root Cause, Timeline, was wir tun, damit es nicht wiederholt).
Regel: Verwenden Sie niemals vage Phrasen wie „experiencing some issues". Kunden wollen Konkretheit: „Login schlägt für ~30% der Versuche fehl. API funktioniert normal. Web ist nur im Read-Only-Modus verfügbar."
Hosting: Prinzip unabhängiger Infrastruktur
Die Status Page muss auf anderer Infrastruktur als der überwachte Dienst laufen. Wenn Ihre AWS-Region fällt, fällt auch Ihre Status Page, die auf derselben AWS-Region gehostet ist - genau wenn Kunden sie am meisten brauchen.
Praktische Lösungen:
- Hosting via externes SaaS (StatusPage.io, ePulz.io, Better Stack, Statuspage)
- Eigene statische Seite auf CDN (Cloudflare Pages, Netlify) mit API-Endpoint anderswo
- Worst Case: minimale statische Seite auf Cloudflare mit manuell aktualisiertem Text
Subscribers: E-Mail / RSS / Webhook
Kunden wollen die Status Page nicht wiederholt aktualisieren. Eine gute Seite unterstützt:
- Email Subscribers - in ePulz.io verfügbar für eingeloggte Nutzer mit Bezahlplan (wir sammeln Abos nur von verifizierten Konten, nicht von anonymen Besuchern)
- RSS / Atom Feed - traditioneller Weg für tech-savvy Users
- Webhook - für Teams, die in ihr Slack oder PagerDuty integrieren wollen
Anti-Pattern: Probleme verstecken
Die Versuchung ist groß, einen Ausfall als „degraded" statt „down" zu markieren oder ihn gar nicht zu zeigen. Das ist kurzsichtig:
- Kunden werden es trotzdem registrieren (eigenes Monitoring, Support Ticket Flow, soziale Netzwerke)
- Vertrauensverlust, wenn sie merken, dass der Status „OK" sagt während eines offensichtlichen Ausfalls
- Kein Bild des echten Uptime-Trends für interne Entscheidungsfindung
Beste Strategie: radikale Transparenz. GitLab, Cloudflare, Stripe veröffentlichen alle detaillierte Post-Mortems sogar bei peinlichen Fehlern. Die Community schätzt es.
SEO und Brand
Die Status Page sollte:
- Auf eigener Subdomain sein (
status.example.com) oder URL-Präfix - Eigenes Branding haben (Logo, Farben) - Kunde muss wissen, dass er auf Ihrer Seite ist
- In Google indexiert sein (bessere Visibility bei „[brand] down" Suche)
- Von Hauptseite verlinkt (Footer „Service Status")
Fazit
Status Page ist keine Dekoration. Es ist ein operatives Tool, das Support-Kosten während eines Vorfalls reduziert und langfristiges Vertrauen aufbaut. Investition von 1-2 Stunden in richtige Konfiguration zahlt sich beim ersten größeren Ausfall aus.
Erstellen Sie eine Status Page in 5 Minuten
ePulz.io Status Pages mit eigenem Branding, Email Subscribers und Incident Timeline. 7 Tage kostenlos.
ePulz.io kostenlos testen - 7 Tage, ohne Kreditkarte.
Konto erstellen