Jaké metriky sledovat pro zajištění dostupnosti serveru?
Když se bavíme o správě serverů, je jasné, že dostupnost je naprosto klíčová. Vlastně, pokud server není dostupný, tak jako by vůbec neexistoval. Ale co všechno bych měl vlastně sledovat, abych měl jistotu, že můj server je v pořádku a funguje jak má? Myslím tím měřit nejenom samotný čas provozu, ale i další aspekty, které mohou ovlivnit to, zda se k serveru uživatelé dostanou nebo ne. Jaké základní metriky by měly být na mém radarovém displeji? Je třeba mít na paměti latenci, tedy čas, za který se odezva vrátí, a jak velký vliv má na uživatelský zážitek. Dále mě zajímá také zatížení CPU a RAM – jak moc jsou moje zdroje využívány a kdy už by to mohlo být na hraně? A co diskový prostor? Jak moc mi zbývá místa a jaký to může mít dopad na výkon a dostupnost? Pak tu máme také monitorování síťového provozu. Jak poznat, kdy je síť přetížená nebo když dochází k nějakým problémům s připojením? Existují nějaké konkrétní hodnoty nebo prahové limity, které bych měl mít na paměti? Slyšel jsem něco o nástrojích pro monitoring serverů; doporučili byste nějaké konkrétní? Jak často by měly být metriky sledovány, aby byla zajištěna maximální efektivita a dostupnost? Zkrátka, co všechno by měl člověk mít na paměti při sledování výkonu a dostupnosti svého serveru?