Gemini 3 drtí konkurenci: Nová AI od Googlu překonává GPT i Claude

Google tento týden uvedl na trh AI model Gemini 3 Pro, který v benchmarkových testech překonal i největší konkurenty jako GPT-5.1 a Claude 4.5. Nová verze přináší vylepšení v logickém uvažování, konverzaci, kódování i matematice a podle Googlu jde o nejinteligentnější AI, jakou dosud vytvořil.

Společnost Google tento týden v úterý vydala dlouho očekávaný model umělé inteligence Gemini 3. Technologický gigant se sídlem v Mountain View v příspěvku na svém blogu uvedl, že jde o nejinteligentnější AI, kterou firma dosud vyvinula. Toto tvrzení potvrzují výsledky hlavních benchmarkových testů, ve kterých Gemini 3 překonává nejen své předchůdce, ale i konkurenční GPT-5.1 či Claude Sonnet 4.5.

V čem je nová verze Gemini lepší

Zdokonalený model Gemini přináší zlepšení hned v několika oblastech, včetně uvažování, konverzace, kódování, matematiky či agentních schopností. Právě poslední zmiňovaný bod představuje podle Googlu významný krok vpřed v rámci uživatelské přístupnosti. Základ agentských funkcí Gemini položila již verze 2, Gemini 2.5 je dále rozvinula a stávající Gemini 3 je jejich pomyslným vyvrcholením.

Obrázek: Gemini 3 drtí konkurenci: Nová AI od Googlu překonává GPT i Claude

Gemini 3 Pro s přehledem dominuje tabulce výsledků současných AI modelů v benchmarkových testech. Foto: Se souhlasem Google

Aktuální řada Gemini 3 zahrnuje dva modely – Gemini 3 Pro a Gemini 3 Deep Think. Společnost Google v současné době zavádí do běžného provozu výkonnou variantu Pro, která se postupně dostává do celé řady nástrojů, od webového prohlížeče přes AI vyhledávání až po vývojářské nástroje AI Studio a Vertex AI. Gemini 3 Pro ve srovnávacích testech s přehledem porazil předchozí verzi 2.5, ale rovněž i nedávno představený GPT-5.1 od OpenAI. Až na dvě výjimky (AIME 2025 a SWE-Bench pro matematiku a kódování) pak překonal i Claude Sonnet 4.5 vyvíjený společností Anthropic.

Gemini 3 Pro sklízí pozitivní hodnocení v testech i od uživatelů

Za zmínku stojí mimo jiné skóre 37,5 % v benchmarku Humanity’s Last Exam zaměřeném na akademické uvažování. Tento test je dlouhodobě považován za jednu z nejnáročnějších zkoušek pro AI modely. Dosavadní rekord v jeho řešení držel již zmíněný model GPT-5.1, který dosáhl skóre 26,5 %. Gemini 3 Pro je však o více než deset procentních bodů lepší. Model z dílny Googlu pak zazářil i v testu ARC-AGI-2, který slouží jako benchmark pro umělou obecnou inteligenci (AGI). Aktuální verze Gemini v něm získala skóre 31,1 %, což je oproti variantě 2.5 Pro se skóre 4,9 % více než šestinásobné zlepšení. Znatelný je i rozdíl při srovnání s dosavadním rekordmanem GPT-5.1 a jeho skóre 17,7 %.

Uvažující alternativa Deep Think stále prochází testováním, po uvedení na trh by ji měli moci využívat předplatitelé programu Google AI Ultra. Podle vývojářů ale půjde o ještě pokročilejší verzi Gemini s deklarovaným výkonem 41,0 % v testu Humanity’s Last Exam a 45,1 % v testu ARC-AGI-2.

Gemini 3 Pro již slaví úspěch i mezi samotnými uživateli, kteří se na sociálních sítích chlubí vlastními zkušenostmi po prvních dnech od spuštění modelu. Společnost Google si tak na svůj účet připisuje další významný pokrok v éře moderních AI technologií.

Zdroje: Blog Google, redakce inSmart.cz

Úvodní foto: Se souhlasem Google

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Obrázek: Recenze Plaud Note Pro: Nejchytřejší AI diktafon na trhu nově s displejem
88%
Recenze Plaud Note Pro: Nejchytřejší AI diktafon na trhu nově s displejem
Historický moment pro Teslu: Autonomní řízení FSD Supervised prošlo evropskou homologací
Konečně! I do starších televizí Samsung přibude dlouho chybějící funkce
Obrázek: Jako v Avatarovi. Firma chce osázet parky svítícími rostlinami
Jako v Avatarovi. Firma chce osázet parky svítícími rostlinami
S hodinkami Huawei konečně zaplatíte i v Česku. Vyzkoušeli jsme to za vás
Tlumočník v mobilu i odstranění objektů z fotek: Co všechno umí umělá inteligence v nových mobilech řady Xiaomi 17?
Obrázek: AI záznamník za tři tisíce? Plaud shodil české ceny na dosud nevídané minimum
AI záznamník za tři tisíce? Plaud shodil české ceny na dosud nevídané minimum
Hrozba týdne #3: Pozor na telefonát z „finančáku“. Jak funguje nový podvod, který se šíří Českem