Serverovny.cz/Fórum/Co se stane, když jeden server spadne při vyvážení zátěže?

Co se stane, když jeden server spadne při vyvážení zátěže?

Zajímalo by mě, co přesně se stane, když jeden server spadne v systému, kde se využívá vyvážení zátěže. Jak to ovlivní ostatní servery a celkovou dostupnost služby? Mám na mysli situace, kdy je serverová infrastruktura nastavená na rozdělování zátěže mezi vícero servery, aby se snížilo riziko přetížení. Představme si, že nějaký server selže třeba kvůli hardwarovému problému nebo výpadku napájení. Jak to celé funguje? Zůstane služba i nadále dostupná, nebo dojde k nějakému výpadku? Jak rychle se obvykle ostatní servery přizpůsobí a převezmou zátěž toho spadlého serveru? Co se děje s uživatelskými relacemi nebo daty, která byla na tom serveru aktivní? A co třeba monitoring a alerting – zjistí se automaticky, že server spadl a systém provede potřebné kroky? Rád bych slyšel příklady z praxe od někoho, kdo se s tímto problémem setkal. Jaké jsou nejlepší postupy pro minimalizaci dopadů takového výpadku? Je lepší mít redundanci na úrovni hardware, software nebo obojí? Díky za jakékoliv info!

156 slov
1.6 minut čtení
10. 3. 2024
Milada Balounová

Když jeden server spadne v systému s vyvažováním zátěže, ostatní servery by měly převzít jeho zátěž, takže služba by měla zůstat dostupná. Jak rychle se to stane závisí na použitém vyvažovači a jak je celý systém nastavený. V ideálním případě by měl být vyvažovač nastavený tak, aby okamžitě přesměroval požadavky na zbývající servery. Často to trvá jen pár sekund, ale občas to může trvat déle, pokud je nějaký problém s detekcí selhání.

Co se týče uživatelských relací a dat, tady to může být problém. Pokud nejsou relace sdílené mezi servery nebo není nastavený nějaký systém pro replikaci dat, může se stát, že uživatelé ztratí aktivní relace nebo data. Proto je dobré mít nějakou formu sdíleného úložiště pro session, aby se to minimalizovalo.

Monitoring a alerting jsou důležité – většina moderních systémů má automatizované sledování, které zjistí výpadek serveru a může poslat upozornění administrátorům nebo dokonce restartovat server.

Co se týče redundance, obojí (hardware i software) je ideální. Redundantní hardware zabraňuje výpadkům na úrovni fyzické infrastruktury a redundance na úrovni aplikace zajišťuje, že i když jedna část selže, služba běží dál. Je dobré mít plán pro disaster recovery a testovat ho pravidelně.

190 slov
1.9 minut čtení
22. 10. 2024
Renata Hanzlová

Když jeden server spadne v load balancingu, většina systémů to zvládne docela dobře. Zatímco ten server je offline, load balancer přesměruje provoz na ostatní servery. To znamená, že uživatelé by měli mít stále přístup k aplikaci nebo službě, i když tam může být malý nárůst zátěže na těch zbývajících serverech. Rychlost, jakou se to stane, závisí na konkrétní konfiguraci – většina moderních load balancerů to zvládne během pár sekund.

Co se týče relací a dat, pokud není implementována správná strategie pro ukládání stavu (např. persistentní databáze nebo sdílené úložiště), tak by mohly být ztraceny. To je často problém u aplikací, které mají hodně uživatelských relací uložených na konkrétním serveru.

S monitoringem a alertingem je dobré mít nějaký systém, který tě upozorní na to, že server spadl. Můžeš použít nástroje jako Prometheus nebo Grafana pro sledování a automatizaci alertů. Když server spadne, prostě by měl být nasazen automaticky nějaký backup nebo restart.

Nejlepší postupy zahrnují mít redundanci jak na úrovni hardwaru (víc serverů), tak i softwaru (např. replikace databází). Když máš obojí, snižuješ riziko výpadku a zvyšuješ dostupnost služby. Takže jo, snažit se o to mít co největší odolnost je určitě na místě.

191 slov
1.9 minut čtení
23. 9. 2024
Roman Matoušek
Serverovny.cz/Články/Serverové komponenty
Vyvážení zátěže mezi servery: Jak efektivně distribuovat provoz?Objevte tajemství efektivního load balancingu a naučte se, jak správně distribuovat provoz mezi servery pro zajištění vysoké dostupnosti.
1000 slov
10 minut čtení
8. 9. 2023
Adam Veselý
Přečíst článek
Podobné otázky