Nasazovat update před víkendem byla chyba, komentují čeští experti globální výpadek IT systémů

Globální výpadek IT systémů způsobený aktualizací bezpečnostní služby CrowdStrike vyřadil z provozu miliony počítačů po celém světě. Podle českých odborníků mohli tvůrci softwaru udělat lépe řadu věcí. Podobný incident však podle nich byl jen otázkou času.

Co přesně se stalo? V pátek 19. července v ranních hodinách došlo k rozsáhlým problémům s počítači a servery běžícími na operačním systému Windows. Microsoft za chybu nicméně nemůže. Technická podstata problému spočívala v aktualizaci ovladače Falcon Sensor, kterou využívá bezpečnostní řešení od společnosti CrowdStrike. Tento ovladač, jako většina bezpečnostního softwaru, funguje v režimu jádra (kernel mode) systému Windows, což mu umožňuje monitorovat systémovou aktivitu na nízké úrovni. Chybná aktualizace způsobila, že ovladač (jehož název začíná „C-00000291“ a končí „.sys“) provedl nesprávné čtení paměti na adrese 0x9c, což vedlo k tzv. kernel panic – kritické chybě jádra operačního systému.

Obrázek: Nasazovat update před víkendem byla chyba, komentují čeští experti globální výpadek IT systémů

Počítač není možné plně zapnout. Je zapotřebí, aby správce provedl smazání poškozeného souboru. Bohužel to musí většinou provést manuálně, což u institucí typu aerolinky může znamenat tisíce počítačů. Foto: Redakce inSmart.cz

Na rozdíl od běžných aplikací, které běží v uživatelském režimu a mohou být jednoduše restartovány, chyba v ovladači běžícím v režimu jádra způsobí pád celého systému, projevující se jako „modrá obrazovka smrti“ (BSOD). Jelikož jsou ovladače zařízení načítány při startu počítače, tato chyba uvrhla postižené systémy do nekonečné smyčky restartování a nouzového režimu. Řešení vyžaduje manuální zásah – spuštění systému v nouzovém režimu a odstranění problematického souboru ovladače.

Incident musel jednou přijít, shodují se experti

Václav Svátek, generální ředitel a zakladatel společnosti ČMIS, poukazuje na to, že podobné incidenty mohou postihnout i technologické giganty. „Je zřejmé, že i giganti jako Azure a Microsoft mohou čelit výpadkům. Výpadky mohou postihnout jakoukoliv společnost, bez ohledu na to, jak pečlivě o své služby pečuje,“ říká Svátek.

Podle něj je klíčové důkladné testování před uvedením softwaru na trh. „Každá firma by měla před vydáním nového softwaru pečlivě otestovat všechny možné dopady změn a nové verze systému,“ vysvětluje Svátek. Doporučuje postupné zavádění nového softwaru – nejprve v testovacím prostředí, poté v preprodukci a nakonec v omezeném produkčním prostředí, než dojde k celosvětovému nasazení.

Vratislav Kalenda, spoluzakladatel a CEO vývojářského studia Applifting, vidí problém v širším kontextu. „Odolnost IT systémů je v přímém rozporu s efektivitou,“ říká Kalenda. Poukazuje na to, že ekonomické tlaky nutí firmy hledat nejlevnější řešení, což vede k používání jednoho operačního systému s jedním bezpečnostním programem bez záložního plánu.

Kalenda také kritizuje načasování aktualizace: „A hlavně, neměli nasazovat před víkendem.“ Dodává, že Crowdstrike mohl udělat více pro prevenci takového výpadku, včetně lepšího testování, postupného zavádění aktualizací a lepší edukace zákazníků o rizicích automatických aktualizací pro kritickou infrastrukturu.

Nasazovat aktualizaci naráz v celé firmě je chyba

Juraj Masár, CEO a spoluzakladatel Better Stack, zdůrazňuje důležitost testování i u důvěryhodných dodavatelů. „Platí pravidlo ‚důvěřuj, ale prověřuj‘ – i aktualizace od velkých a důvěryhodných dodavatelů je třeba nejdříve otestovat na oddělené části systému, takzvaném ‚staging environment‘, před nasazením do produkce,“ radí Masár.

Všichni experti se shodují, že podobný incident byl jen otázkou času vzhledem k rostoucí komplexitě a propojenosti moderních IT systémů. Zároveň apelují na firmy, aby věnovaly větší pozornost bezpečnostním postupům a testování před nasazením kritických aktualizací.

Zdroj: Vyjádření odborníků pro inSmart.cz

Odebírat
Upozornit na
guest
2 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Luděk

Dobrý den.
Od minulého týdne(výpadku), jsem pozastavil aktualice PC. Může aktualizace způsobit problém na PC obyčejného řadového uživatele?

Obrázek: HONOR uvedl na český trh Magic V3: Nejtenčí skládací telefon světa vypadá fantasticky. Kolik stojí?
HONOR uvedl na český trh Magic V3: Nejtenčí skládací telefon světa vypadá fantasticky. Kolik stojí?
Obrázek: IFA 2024: HONOR má výkonný 1kg notebook s magnetickou odnímatelnou kamerou
IFA 2024: HONOR má výkonný 1kg notebook s magnetickou odnímatelnou kamerou
Obrázek: Umělá inteligence pro každého. Samsung chce dostat AI do všeho a všem
Umělá inteligence pro každého. Samsung chce dostat AI do všeho a všem
Obrázek: Miniaturní počítač s umělou inteligencí se vejde do dlaně: ASUS představil NUC 14 Pro AI
Miniaturní počítač s umělou inteligencí se vejde do dlaně: ASUS představil NUC 14 Pro AI
Obrázek: Kód, který ochromil svět: Microsoft svolává rivaly, aby odvrátil budoucí kybernetickou apokalypsu
Kód, který ochromil svět: Microsoft svolává rivaly, aby odvrátil budoucí kybernetickou apokalypsu
Obrázek: Perseidy tento víkend naposledy rozzáří letošní noční oblohu. Jak a kde je pozorovat?
Perseidy tento víkend naposledy rozzáří letošní noční oblohu. Jak a kde je pozorovat?
Obrázek: Perseidy, Měsíc i polární záře: Dnes večer koukejte na noční oblohu, podívaná bude stát za to
Perseidy, Měsíc i polární záře: Dnes večer koukejte na noční oblohu, podívaná bude stát za to
Obrázek: Rusko blokuje aplikaci Signal: Jak snadno obejít cenzuru, kdyby to jednou nastalo i u nás?
Rusko blokuje aplikaci Signal: Jak snadno obejít cenzuru, kdyby to jednou nastalo i u nás?