Zpět na blog

Co je uptime a proč na něm záleží

· 5 min čtení

Ve zkratce: Uptime je procento času, po který je váš web dostupný. 99 % zní jako hodně, ale v praxi to znamená přes tři dny výpadku ročně. Pro weby a aplikace, které přinášejí obrat, je realistický cíl alespoň 99,9 % (8,7 hodiny výpadku ročně) - a klíčové je vědět o problému do minuty.

Ve zkratce: Uptime je procento času, po který je váš web dostupný. 99 % zní jako hodně, ale v praxi to znamená přes tři dny výpadku ročně. Pro weby a aplikace, které přinášejí obrat, je realistický cíl alespoň 99,9 % (8,7 hodiny výpadku ročně) - a klíčové je vědět o problému do minuty.

Definice: co přesně měříme

Uptime je poměr času, kdy služba odpovídá podle očekávání (typicky HTTP 200, obsah obsahuje klíčové slovo) k celkovému času měření. Vyjadřuje se v procentech, nejčastěji za období 30 nebo 365 dní.

Opakem je downtime - čas, kdy služba nereaguje, vrací 5xx nebo trvá déle než nastavený timeout. Sem patří i plánovaná údržba, pokud ji explicitně nevyloučíte z výpočtu (což byste měli komunikovat v SLA).

Tabulka "nines": kolik času znamená každé desetinné místo

Uptime Povolený downtime / rok Měsíc Den
99 % 3 dny 15 h 7 h 18 min 14 min
99,5 % 1 den 19 h 3 h 39 min 7 min
99,9 % (three nines) 8 h 45 min 43 min 1 min 26 s
99,95 % 4 h 22 min 21 min 43 s
99,99 % (four nines) 52 min 4 min 22 s 8,6 s
99,999 % (five nines) 5 min 15 s 26 s 0,86 s

Každá další devítka násobí náklady na infrastrukturu. Five nines (99,999 %) je doménou globálních providerů s aktivní redundancí přes kontinenty - pro většinu business aplikací je 99,9 % správný cíl.

Jaký uptime reálně potřebujete

  • Marketingový web (firma, portfolio): 99 % stačí. Návštěvník, který přijde během výpadku, zkusí znovu později.
  • SaaS aplikace s desktop klientem: 99,9 % je minimum. Zákazníci platí za práci, kterou nemohou dělat během downtime.
  • E-shop, platební brána, real-time služba: 99,95 % a více. Každá minuta = přímé ztráty.
  • Infrastruktura (API, které používají jiní): Alespoň 99,99 %. Vaše SLA limituje SLA klientů.

Jak se uptime měří

Monitoring služba periodicky volá váš endpoint (typicky HTTP GET, ale i TCP socket, ICMP ping nebo DNS resolution). Každá kontrola má binární výsledek: up nebo down.

Běžný interval je 1-5 minut. Čím kratší, tím rychleji zachytíte výpadek, ale tím víc false-positive alertů dostanete (lokální network glitch, krátký deploy restart). Řešením je multi-region kontrola: výpadek se potvrdí až když ho hlásí N regionů, ne jen jeden.

Nejčastější zdroje "ztracených nines"

  1. Expirovaný SSL/TLS certifikát. Webový prohlížeč blokuje stránku. Bez monitoringu o tom víte v pondělí ráno, když zazvoní telefon.
  2. Vypršení domény. Celý DNS přestane fungovat. Email, web, status page - všechno padá zároveň.
  3. Padlý databázový worker. Web vrací 500 nebo timeout pro část requestů. Klasický ping z toho možná i projde.
  4. DDoS nebo flooding. Server zatížený, response time stoupá nad limit, monitoring oznámí výpadek.
  5. Botched deploy. Nová verze má bug, který zlomí cestu. Bez integration testů to najdete až když začnou stěžovat zákazníci.

Závěr

Uptime není marketingové číslo - je to měřítko, jak moc se můžete spolehnout na svou vlastní infrastrukturu. 99,9 % uptime není luxus, ale standardní požadavek pro jakoukoli službu, která generuje obrat nebo má platící zákazníky.

Krok jedna je měřit. Pokud nemáte externí monitorování, technicky nevíte, jaký uptime máte - jen odhadujete.

Začněte měřit uptime svých služeb

ePulz.io sleduje vaše endpointy v intervalech od 1 minuty z více regionů. 7 dní zdarma.

Spustit monitoring →


Vyzkoušejte ePulz.io zdarma - 7 dní bez kreditní karty.

Vytvořit účet