Jaké metriky bych měl sledovat na svém serveru?
Když se starám o svůj server, už delší dobu přemýšlím, které metriky jsou opravdu důležité a co všechno bych měl sledovat, abych měl přehled o tom, jak server funguje. Mám na mysli nejen základní věci jako využití procesoru nebo paměti, ale i další ukazatele, které mohou naznačovat, jestli je všechno v pořádku nebo jestli hrozí nějaké problémy. Například, jak moc důležité je sledovat zatížení disku? A co teplota serveru? Jaké hodnoty by měly být alarmující? Slyšel jsem také o výkonnosti sítě – jaký vliv má latence a propustnost na celkové fungování serveru? Je dobré sledovat i logy, a pokud ano, co přesně by měly obsahovat? Jak často bych měl kontrolovat tyto metriky? Existují nějaké nástroje, které mi mohou s tímto sledováním pomoci? Rád bych se dozvěděl názory a zkušenosti ostatních správců serverů, kteří se s tímto tématem už setkali. Co tedy považujete za klíčové metriky pro monitorování vašeho serveru?