Co je uptime a proč na něm záleží
· 5 min čtení
Ve zkratce: Uptime je procento času, po který je váš web dostupný. 99 % zní jako hodně, ale v praxi to znamená přes tři dny výpadku ročně. Pro weby a aplikace, které přinášejí obrat, je realistický cíl alespoň 99,9 % (8,7 hodiny výpadku ročně) - a klíčové je vědět o problému do minuty.
Ve zkratce: Uptime je procento času, po který je váš web dostupný. 99 % zní jako hodně, ale v praxi to znamená přes tři dny výpadku ročně. Pro weby a aplikace, které přinášejí obrat, je realistický cíl alespoň 99,9 % (8,7 hodiny výpadku ročně) - a klíčové je vědět o problému do minuty.
Definice: co přesně měříme
Uptime je poměr času, kdy služba odpovídá podle očekávání (typicky HTTP 200, obsah obsahuje klíčové slovo) k celkovému času měření. Vyjadřuje se v procentech, nejčastěji za období 30 nebo 365 dní.
Opakem je downtime - čas, kdy služba nereaguje, vrací 5xx nebo trvá déle než nastavený timeout. Sem patří i plánovaná údržba, pokud ji explicitně nevyloučíte z výpočtu (což byste měli komunikovat v SLA).
Tabulka "nines": kolik času znamená každé desetinné místo
| Uptime | Povolený downtime / rok | Měsíc | Den |
|---|---|---|---|
| 99 % | 3 dny 15 h | 7 h 18 min | 14 min |
| 99,5 % | 1 den 19 h | 3 h 39 min | 7 min |
| 99,9 % (three nines) | 8 h 45 min | 43 min | 1 min 26 s |
| 99,95 % | 4 h 22 min | 21 min | 43 s |
| 99,99 % (four nines) | 52 min | 4 min 22 s | 8,6 s |
| 99,999 % (five nines) | 5 min 15 s | 26 s | 0,86 s |
Každá další devítka násobí náklady na infrastrukturu. Five nines (99,999 %) je doménou globálních providerů s aktivní redundancí přes kontinenty - pro většinu business aplikací je 99,9 % správný cíl.
Jaký uptime reálně potřebujete
- Marketingový web (firma, portfolio): 99 % stačí. Návštěvník, který přijde během výpadku, zkusí znovu později.
- SaaS aplikace s desktop klientem: 99,9 % je minimum. Zákazníci platí za práci, kterou nemohou dělat během downtime.
- E-shop, platební brána, real-time služba: 99,95 % a více. Každá minuta = přímé ztráty.
- Infrastruktura (API, které používají jiní): Alespoň 99,99 %. Vaše SLA limituje SLA klientů.
Jak se uptime měří
Monitoring služba periodicky volá váš endpoint (typicky HTTP GET, ale i TCP socket, ICMP ping nebo DNS resolution). Každá kontrola má binární výsledek: up nebo down.
Běžný interval je 1-5 minut. Čím kratší, tím rychleji zachytíte výpadek, ale tím víc false-positive alertů dostanete (lokální network glitch, krátký deploy restart). Řešením je multi-region kontrola: výpadek se potvrdí až když ho hlásí N regionů, ne jen jeden.
Nejčastější zdroje "ztracených nines"
- Expirovaný SSL/TLS certifikát. Webový prohlížeč blokuje stránku. Bez monitoringu o tom víte v pondělí ráno, když zazvoní telefon.
- Vypršení domény. Celý DNS přestane fungovat. Email, web, status page - všechno padá zároveň.
- Padlý databázový worker. Web vrací 500 nebo timeout pro část requestů. Klasický ping z toho možná i projde.
- DDoS nebo flooding. Server zatížený, response time stoupá nad limit, monitoring oznámí výpadek.
- Botched deploy. Nová verze má bug, který zlomí cestu. Bez integration testů to najdete až když začnou stěžovat zákazníci.
Závěr
Uptime není marketingové číslo - je to měřítko, jak moc se můžete spolehnout na svou vlastní infrastrukturu. 99,9 % uptime není luxus, ale standardní požadavek pro jakoukoli službu, která generuje obrat nebo má platící zákazníky.
Krok jedna je měřit. Pokud nemáte externí monitorování, technicky nevíte, jaký uptime máte - jen odhadujete.
Začněte měřit uptime svých služeb
ePulz.io sleduje vaše endpointy v intervalech od 1 minuty z více regionů. 7 dní zdarma.
Vyzkoušejte ePulz.io zdarma - 7 dní bez kreditní karty.
Vytvořit účet