Serverovny.cz/Fórum/Co se stane, když se jeden komponent v redundantním serveru pokazí?

Co se stane, když se jeden komponent v redundantním serveru pokazí?

Zajímalo by mě, co přesně se děje, když selže nějaký komponent v redundantním serveru. Mám na mysli situace, kdy máme serverovou infrastrukturu, která je postavená na principech redundance, jako jsou například RAID pole nebo vícero napájecích zdrojů. Co se stane, když třeba odejde jeden disk v RAIDu? Bude server nadále fungovat bez výpadku, nebo to způsobí nějaké komplikace? A co když při selhání dojde k tomu, že backup systém také selže? Jak to vlastně celé funguje? Co dělají administrátoři v takových případech? Je to něco, co lze snadno vyřešit na místě, nebo to vyžaduje zásah specialisty? Může selhání jednoho komponentu ovlivnit i ostatní části systému? A jak dlouho trvá obvykle oprava nebo výměna vadného dílu bez toho, aby došlo ke ztrátě dat nebo výraznému narušení služeb? Jaké jsou nejlepší praktiky pro zajištění toho, aby se takové incidenty daly minimalizovat? Opravdu je ta redundance tak spolehlivá, jak se říká? Rád bych znal názory a zkušenosti ostatních ohledně této problematiky. Díky!

159 slov
1.6 minut čtení
13. 7. 2023
Jan Vítek

Když se něco v redundantním serveru pokazí, záleží na tom, co přesně to je. Třeba když odejde disk v RAIDu, většina systémů dokáže fungovat dál bez většího výpadku. RAID je navržený tak, aby nějaké disky zvládl a data byla chráněná. Ale pokud ti odejde víc disků najednou nebo dojde k chybě u RAID kontroleru, může to být problém. To samý platí pro napájecí zdroje – pokud máš víc než jeden a jeden selže, tak ten druhý by měl server podržet.

Pokud backup systém selže taky, no to už může být dost špatný. Proto je dobrý mít víc úrovní zálohování, ideálně i off-site, protože nikdy nevíš.

Administrátoři obvykle monitorují systémy, takže by měli mít nějaké upozornění na poruchy a můžou se hned pustit do akce. Oprava může trvat různě dlouho podle toho, co se pokazilo a jestli mají náhradní díly hned po ruce. Někdy může jít o pár hodin, někdy klidně i den či dva.

Nejlepší praxe je mít plán údržby a pravidelně kontrolovat hardware. Dobrý monitoring a varování ti mohou pomoci problémům předejít. Redundance zní skvěle a většinou funguje, ale nikdy to není 100% jistota. Takže radši buď připravený na cokoliv.

188 slov
1.9 minut čtení
8. 5. 2023
Jindřich Adamec

No, když se něco v redundantním serveru posere, záleží na tom, co přesně to je. U RAIDu třeba, když odejde jeden disk, většina moderních RAID konfigurací jako RAID 1 nebo RAID 5 to ustojí, a server běží dál bez větších problémů. Jenom je dobrý mít na paměti, že performance může klesnout, a když odejde další disk, tak už to může být průšvih.

Co se týče napájecích zdrojů, tak mnohdy jsou duální a když jeden spadne, tak ten druhej to zvládne. Ale pokud i ten druhý selže, tak se klidně můžeš dostat do potíží.

Záložní systém by měl být oddělený, ale stává se, že když je fatální problém v serveru, tak backup taky přestane fungovat. To už je pak zásah pro specialistu a admini mají plno práce s tím to řešit. Opravy obvykle trvají pár hodin, pokud nejsou komplikace.

Ideálně bys měl mít pravidelné kontroly a monitoring, aby ses vyhnul nečekaným selháním. Redundance je fajn, ale nikdy není stoprocentní. Takže nejlepší praxí je mít plán na obnovu dat a testovat ho pravidelně.

169 slov
1.7 minut čtení
31. 3. 2024
Daniel Vondra

Když v redundantním serveru selže jeden komponent, tak záleží na tom, co přesně odejde. Například u RAID pole, pokud odejde jeden disk, server by měl fungovat dál, protože ostatní disky převezmou zátěž. Ale je důležité mít zálohy, protože pokud selže další disk, tak se můžeš dostat do problémů a data by mohla být ztracena. Napájecí zdroje fungují podobně – pokud máš dva a jeden odejde, druhý to většinou zvládne bez problému.

Pokud backup systém také selže ve stejný moment, to už může být komplikace. Administrátoři obvykle monitorují systémy a mohou dostat upozornění na selhání, takže mají šanci zasáhnout dřív, než vznikne větší problém. Co se týče výměny vadného dílu, tak záleží na dostupnosti náhradního dílu – někdy to jde rychle, jindy může trvat i déle.

Nejlepší praktiky pro minimalizaci problémů zahrnují pravidelnou údržbu a testování záloh. Redundance je celkově spolehlivá, ale není to stoprocentní záruka – vždycky je potřeba mít plán B pro případ velkého výpadku. Takže jo, je to složité, ale když se to dělá správně, tak se dá minimalizovat riziko.

170 slov
1.7 minut čtení
9. 12. 2024
Veronika Hlávková
Serverovny.cz/Články/Výběr hardwaru
Proč zvolit server s redundantními komponenty?Získejte přehled o výhodách redundantních komponentů v serverech a jak mohou zvýšit dostupnost vašich systémů. Porozumějte důležitosti redundantních n...
1000 slov
10 minut čtení
26. 10. 2021
Ing. Kristýna Svobodová
Přečíst článek
Podobné otázky