Co to jest uptime i dlaczego ma znaczenie
· 5 min czytania
W skrócie: Uptime to procent czasu, w którym Twoja strona jest dostępna. 99 % brzmi jak dużo, ale w praktyce oznacza ponad trzy dni awarii rocznie. Dla stron i aplikacji generujących obrót realistycznym celem jest co najmniej 99,9 % (8,7 godziny awarii rocznie) - a kluczowe jest wiedzieć o problemie w ciągu minuty.
W skrócie: Uptime to procent czasu, w którym Twoja strona jest dostępna. 99 % brzmi jak dużo, ale w praktyce oznacza ponad trzy dni awarii rocznie. Dla stron i aplikacji generujących obrót realistycznym celem jest co najmniej 99,9 % (8,7 godziny awarii rocznie) - a kluczowe jest wiedzieć o problemie w ciągu minuty.
Definicja: co dokładnie mierzymy
Uptime to stosunek czasu, w którym usługa odpowiada zgodnie z oczekiwaniami (typowo HTTP 200, treść zawiera słowo kluczowe) do całkowitego czasu pomiaru. Wyrażany w procentach, najczęściej dla okresu 30 lub 365 dni.
Przeciwieństwem jest downtime - czas, gdy usługa nie odpowiada, zwraca 5xx lub trwa dłużej niż ustawiony timeout. Należy tu również planowana konserwacja, jeśli wprost jej nie wyłączysz z obliczeń (co powinno być komunikowane w SLA).
Tabela "dziewiątek": ile czasu oznacza każde miejsce dziesiętne
| Uptime | Dozwolony downtime / rok | Miesiąc | Dzień |
|---|---|---|---|
| 99 % | 3 dni 15 h | 7 h 18 min | 14 min |
| 99,5 % | 1 dzień 19 h | 3 h 39 min | 7 min |
| 99,9 % (three nines) | 8 h 45 min | 43 min | 1 min 26 s |
| 99,95 % | 4 h 22 min | 21 min | 43 s |
| 99,99 % (four nines) | 52 min | 4 min 22 s | 8,6 s |
| 99,999 % (five nines) | 5 min 15 s | 26 s | 0,86 s |
Każda kolejna dziewiątka mnoży koszty infrastruktury. Five nines (99,999 %) to domena globalnych dostawców z aktywną redundancją między kontynentami - dla większości aplikacji biznesowych 99,9 % to właściwy cel.
Jakiego uptime'u faktycznie potrzebujesz
- Strona marketingowa (firma, portfolio): 99 % wystarczy. Odwiedzający, który przyjdzie podczas awarii, spróbuje później.
- Aplikacja SaaS z klientem desktop: 99,9 % to minimum. Klienci płacą za pracę, której nie mogą wykonać podczas downtime.
- E-sklep, bramka płatności, usługa real-time: 99,95 % i więcej. Każda minuta = bezpośrednie straty.
- Infrastruktura (API używane przez innych): Co najmniej 99,99 %. Twoje SLA ogranicza SLA klientów.
Jak mierzy się uptime
Usługa monitorująca okresowo wywołuje Twój endpoint (typowo HTTP GET, ale również TCP socket, ICMP ping lub DNS resolution). Każde sprawdzenie ma binarny wynik: up lub down.
Typowy interwał to 1-5 minut. Im krótszy, tym szybciej wyłapiesz awarię, ale tym więcej false-positive alertów dostaniesz (lokalny network glitch, krótki restart deploy). Rozwiązaniem jest kontrola multi-region: awaria potwierdza się dopiero gdy zgłosi ją N regionów, nie tylko jeden.
Najczęstsze źródła "utraconych dziewiątek"
- Wygasły certyfikat SSL/TLS. Przeglądarka blokuje stronę. Bez monitoringu dowiesz się w poniedziałek rano, gdy zadzwoni telefon.
- Wygaśnięcie domeny. Cały DNS przestaje działać. Email, web, status page - wszystko spada jednocześnie.
- Padły worker bazy danych. Strona zwraca 500 lub timeout dla części requestów. Klasyczny ping może nawet przejść.
- DDoS lub flooding. Serwer obciążony, response time rośnie powyżej limitu, monitoring zgłasza awarię.
- Botched deploy. Nowa wersja ma bug, który łamie ścieżkę. Bez testów integracyjnych znajdziesz to dopiero gdy zaczną narzekać klienci.
Wnioski
Uptime to nie liczba marketingowa - to miara tego, na ile możesz polegać na własnej infrastrukturze. 99,9 % uptime to nie luksus, ale standardowy wymóg dla każdej usługi generującej obrót lub mającej płacących klientów.
Krok pierwszy to mierzyć. Jeśli nie masz zewnętrznego monitoringu, technicznie nie wiesz jakiego uptime'u masz - tylko zgadujesz.
Zacznij mierzyć uptime swoich usług
ePulz.io śledzi Twoje endpointy w interwałach od 1 minuty z wielu regionów. 7 dni za darmo.
Wypróbuj ePulz.io za darmo - 7 dni bez karty kredytowej.
Załóż konto