Co dělat, když se mi nedaří eskalovat problémy u serverového monitoringu?
Mám takový problém, už nějakou dobu se snažím vyřešit otázku, co dělat, když se mi nedaří eskalovat problémy u serverového monitoringu. Vždycky se mi zdá, že když nějaký problém nastane, tak to jen tak zůstává viset ve vzduchu a nikam to nevede. Mám nastavený monitoring pomocí několika nástrojů, ale když se něco pokazí, jako například vysoká latence nebo výpadky některých služeb, prostě nevím, jak to správně eskalovat. Zkoušel jsem posílat notifikace přes email, ale zdá se mi, že moc lidí nereaguje. Jak mám zajistit, aby si toho někdo všiml a začal to řešit? Myslel jsem si, že by bylo dobré mít nějaký proces na eskalaci problémů, ale zatím jsem nic takového nevytvořil. Také by mě zajímalo, jestli je lepší mít centrální komunikační kanál pro všechny incidenty nebo jestli je fajn používat různé platformy podle toho, co se děje. Možná dělám něco špatně, ale nemám pocit, že by moje upozornění na problémy byly dostatečně viditelné. Co s tím? Jakou máte zkušenost vy ostatní? Co fungovalo vám při řešení podobných situací? Rád bych slyšel nějaké tipy nebo osvědčené postupy od těch, kteří už si tím prošli. Díky!