Vědci si nedávno posvítili na porovnání výkonu AI modelů v lékařské diagnostice. Pomyslným vítězem studie se stal nový nástroj z dílny Microsoftu, který svým výkonem i efektivitou překonal skutečné doktory.
Nejnovější model umělé inteligence společnosti Microsoft na sebe v poslední době strhl velkou vlnu pozornosti. Nástroj nazvaný Microsoft AI Diagnostic Orchestrator (MAI-DxO) překvapil v nedávné srovnávací studii zaměřené na výkon AI v diagnostice skutečných lékařských případů. Hlavní závěry výzkumu pak Microsoft shrnul také na svém webu. Co z této práce vyplývá?
Ak ste chorý, kto najpresnejšie zistí, čo vám je?
Testované na súbore 304 rôznych pacientov s komplikovanými diagnózami. Výsledky približne:
1. Microsoft
2. ChatGPT
3. Google
4. Anthropic
5. xAI (TWITTER!)
6. Facebook AI (FACEBOOK!!!)
7. Najlepší lekár, akého do štúdie našli
8.… https://t.co/YHtNvYshLU— Tomáš Bella (@kvasinka) June 30, 2025
Nejvýkonnější modely od OpenAI, Mety, Googlu a mimo jiné i Microsoftu se utkaly ve vyhodnocení více než 300 náročných případových studiích publikovaných v časopise New England Journal of Medicine. Podobně jako skuteční lékaři tak AI musela postupně projít zdravotní dokumentaci, navrhnout vhodné diagnostické metody a následně reagovat na výsledky testů. Byl to pak právě model MAI-DxO, který mezi ostatními vyčníval svou schopností podložit svá tvrzení adekvátními argumenty, díky čemuž bylo možné průběžně sledovat její uvažování. Vědci tak měli přehled o tom, jak umělá inteligence dospěla ke svým závěrům.
Umělá inteligence převálcovala lidské mozky
Studie u MAI-DxO vyzdvihovala také další aspekty, mimo jiné jeho schopnost přistupovat v diagnostice z pohledu praktického lékaře a zároveň i specialisty. I díky tomu se tak modelu nakonec podařilo úspěšně vyřešit 80 % zkoumaných případů, zatímco lidští lékaři jich dokázali rozlousknout pouze 20 %. Umělá inteligence od Microsoftu to navíc zvládla s menším počtem testů, a výrazně tak snížila náklady na stanovení správné diagnózy.
Přímé srovnání diagnostických výkonů AI a člověka hovoří v jasný neprospěch lidských sil. Foto: Se souhlasem Microsoft
Přestože se může zdát, že AI dokázala člověka konečně překonat i v tak komplexním odvětví, jako je medicína, její autoři tvrdí, že cílem této umělé inteligence není nahradit lidské lékaře. V dalších fázích testování by se nástroj měl dostat do klinického testování mimo kontrolované prostředí, v konečném výsledku však bude i tak fungovat pouze jako asistent skutečných diagnostiků.