História incidentov, MTTR, MTBF
História incidentov, MTTR, MTBF
3 min čítania
Štatistiky odpovedajú na otázky "ako často nám padá", "ako dlho to trvá kým sa to vrátí", "kedy sme mali najhorší týždeň". V detaile monitora → záložka Štatistiky.
Kľúčové metriky
Uptime %
Pomer času UP / celkový čas. Klasická metrika. ePulz.io ráta cez 24h / 7d / 30d / 90d / 365d windows.
MTTR (Mean Time To Recovery)
Priemerný čas od detekcie DOWN po návrat UP. Ak máte 5 incidentov a každý trval 8 minút, MTTR = 8 min. Goal: znižovať cez lepší alerting, auto-restart, on-call rotácie.
MTBF (Mean Time Between Failures)
Priemerný čas medzi výpadkami. Ak máte 5 výpadkov za 30 dní = MTBF 6 dní. Goal: zvyšovať cez redundanciu, lepšie testovanie, postmortem action items.
Incident frequency
Počet incidentov po týždňoch / mesiacoch. Sledujte trend - mali by ste vidieť pokles po vašich SRE iniciatívach.
Tabuľka incidentov
Posledných 50 incidentov so stĺpcami:
- Začiatok DOWN (timestamp)
- Koniec / aktívny (timestamp alebo "→ aktívny")
- Trvanie (HH:MM:SS)
- Dôvod (HTTP 502, SSL expired, DNS timeout, keyword missing...)
- Region consensus (ak multi-region: ktoré regióny potvrdili)
Export
Tlačidlo "Export CSV" stiahne tabuľku incidentov pre import do Excelu / BI nástroja. PDF SLA report viď SLA reporty.