Již stým týdnem vám přinášíme pravidelný přehled novinek ze světa umělé inteligence. V prvním díle našeho speciálu publikovaného v březnu 2023 ještě neexistovala Gemini AI, ChatGPT sloužil primárně jako experimentální chatovací platforma a praktické využití AI bylo stále v plenkách. Kde se umělá inteligence nachází dnes, o více než 2 roky později?
- 1. Testem pro obecnou umělou inteligenci zatím neprošel žádný z dostupných modelů
- 2. OpenAI představila revoluci v generování obrazů pomocí GPT-4o
- 3. Google a AI: Vylepšená práce s kódováním, chytřejší Gmail a příchod verze 2.5
- 4. Model Claude se učí pracovat s vyhledáváním informací na internetu
- 5. Pokroky z Východu: Aktualizace DeepSeek-V3, uvažující model od Tencentu i sebevražedné AI drony ze Severní Koreje
- 6. NVIDIA představila AI, která dokáže učit roboty v simulovaném prostředí
- 7. Apple údajně uvažuje o tom, že by ze svých hodinek udělal nositelné AI zařízení
Testem pro obecnou umělou inteligenci zatím neprošel žádný z dostupných modelů
Nadace ARC Prize Foundation vyvinula test pro hodnocení výkonnosti současných modelů umělé inteligence. Program s názvem ARC-AGI-2 navazuje na předchozí verzi ARC-AGI-1, která byla spuštěna v roce 2019 a kterou se rovněž nedařilo žádnému z komerčních modelů vyřešit – zkoušku prolomil až model o3 (low) od OpenAI, a to v prosinci loňského roku. Současný test má pak sloužit primárně jako měřítko schopností obecné umělé inteligence (AGI). Zatímco lidé v testu obvykle obstojí, modely AI v něm selhávají.

I takto může vypadat úloha, kterou mají modely za úkol vyřešit. Dokážete to vy? Foto: Se souhlasem ARC
Je zřejmé, že od konceptu AGI jsme zatím ještě poměrně daleko, vědce ale překvapilo, jak špatně si současné modely vedly. Rozumové modely jako o1 od OpenAI nebo R1 od DeepSeek zvládly 1 %, respektive 1,3 %. Podobných výsledků dosáhly i GPT-4.5, Claude 3.7 Sonnet nebo Gemini 2.0 Flash. Do hodnocení testu ARC-AGI-2 se kromě schopnosti vyřešit konkrétní úlohy počítala i celková efektivita procesu. Úspěšnost v testu si můžete ověřit i vy sami, a to na oficiálním webu ARC.
OpenAI představila revoluci v generování obrazů pomocí GPT-4o
OpenAI tento týden ukázala, co umí jejich nový systém pro tvorbu obrázků zabudovaný do GPT-4o. Oproti starším verzím jde o pořádnou změnu – model teď chápe obrázky i text současně a soustředí se hlavně na to, aby výsledky byly přesné, ne jen hezké na pohled.
Co je na něm tak unikátního? Hlavně to, jak přesně dokáže vykreslit text v obrázcích, což byl doteď docela problém. Když mu řeknete, co přesně chcete, opravdu to udělá – ne jako některé jiné systémy, které vaše zadání občas „kreativně přeinterpretují“. Zajímavé je, že zvládne pracovat až s dvakrát tolika objekty v jednom obrázku než konkurence – místo obvyklých 5-8 věcí dokáže GPT-4o zpracovat 10-20 prvků najednou, a ještě je správně propojit.
🔥It's been 24 hours since #OpenAI unexpectedly shook the #AI image world with 4o image generation.
Here are examples so far (100% AI-generated):
Studio #ghibli style memes
Just go to #ChatGPT and enable gpt 5.4 and type prompt “Make this ghibli anime style” pic.twitter.com/PSrSJn4Xjl
— ꧁𝐒𝐨𝐫𝐨𝐮𝐬𝐡꧂ (@WeAreNearYou) March 27, 2025
Vývojáři ho nakrmili směsí obrázků a textů z internetu, takže chápe nejen vztah mezi slovy a obrazy, ale i mezi různými obrázky navzájem. Efektní je, že když mu nahrajete vlastní fotku, dokáže s ní pracovat a použít detaily z ní při vytváření nových obrázků.
Od tohoto týdne si s ním můžou hrát uživatelé ChatGPT s účty Plus, Pro a Team. Vývojáři se k modelu přes API dostanou za pár týdnů. A abychom věděli, co je pravé a co vygenerované, každý obrázek dostane do vínku speciální digitální certifikát C2PA. Doba postfaktická je už definitivně tady.
Google a AI: Vylepšená práce s kódováním, chytřejší Gmail a příchod verze 2.5
Společnost Google nám v posledních dnech představila celou řadu inovativních AI nástrojů. První balíček novinek obsahuje podporu interaktivního prostoru Canvas, který umožňuje lidským uživatelům a AI spolupracovat na projektech souvisejících s kódováním. Kromě toho se do Gemini dostává i funkce Audio Overview, která byla původně exkluzivní pro zařízení NotebookLM. Uživatelé díky ní mohou nechat AI vygenerovat komplexní zvukový výstup na dané téma ve stylu podcastu, a to na základě poskytnutých dokumentů či zpráv Deep Research.
Kromě toho se vylepšení funkcemi umělé inteligence dočkala i služba Gmail. V e-mailu by nyní mělo být snazší najít relevantní zprávy, a to díky možnosti řadit výsledky podle nejdůležitějších. Gmail se tak po nedávné integraci Gemini schopné například pracovat s kalendářem posouvá v éře AI opět o další významný krok vpřed.
Poslední velkou událostí poslední doby společnosti se sídlem v americkém Mountain View je pak odhalení nástupců modelů řady Gemini 2.0. Skupina nástrojů s názvem Gemini 2.5 Pro Experimental by podle Googlu měla mít přímo zabudovanou schopnost uvažování či určité formy myšlení. Nové modely navíc posouvají výkonnostní hranice nad současné limity benchmarkových testů, a překonávají tak například konkurenční o3-mini od OpenAI. Gemini 2.5 by se měl průběžně dostat ke všem uživatelům služby.
Model Claude se učí pracovat s vyhledáváním informací na internetu
Společnost Anthropic minulý týden zpřístupnila svému modelu Claude funkce webového vyhledávání. Nástroj se při komunikaci s uživatelem dosud spoléhal pouze na svou interní databázi znalostí, a byl tak posledním z „velkých“ modelů, které přístup k internetu v průběhu posledních měsíců a let získaly.
Claude can now search the web.
Each response includes inline citations, so you can also verify the sources. pic.twitter.com/iFshgfUEp8
— Anthropic (@AnthropicAI) March 20, 2025
Podle vyjádření společnosti Anthropic bude nyní Claude schopen vyhledávat informace o nejnovějších událostech, což zvýší jeho přesnost. Odpovědi, které obsahují informace z webu, pak model rovnou doplní citací zdroje, což uživateli usnadní hlubší průzkum dané problematiky. Funkce je v současné době k dispozici v náhledu pro placené předplatitele platformy v USA. Již dnes je ale potvrzeno, že by se přístup k internetu měl rozšířit i do dalších zemí, a dokonce i do bezplatné úrovně modelu.
Pokroky z Východu: Aktualizace DeepSeek-V3, uvažující model od Tencentu i sebevražedné AI drony ze Severní Koreje
Asijské modely již několik týdnů úspěšně víří vody světa umělé inteligence a dokazují, že Spojené státy rozhodně nemají na úspěšné AI technologie monopol. Společnost DeepSeek, která tuto novou vlnu obrození v lednu letošního roku zahájila, nedávno aktualizovala svůj model V3. Podle informací z platformy Hugging Face (oficiální oznámení updatu ze strany společnosti zatím nebylo zveřejněno) by nyní model měl „řešit problémy reálného světa a zároveň stanovovat měřítka přesnosti a efektivity.“
Čína také představila další AI model, tentokrát z dílny nadnárodní softwarové korporace Tencent. Nástroj Hunyuan T1 nabízí rychlou odezvu a pokročilé funkce při práci s velkoobjemovými textovými dokumenty. Podle vyjádření společnosti Tencent si navíc zvládá udržet úroveň halucinování na „extrémně nízké“ hladině. Podle některých zveřejněných benchmarků je v některých úlohách dokonce lepší než konkurenční DeepSeek-R1. Model T1 se tak po dříve zveřejněné předběžné verzi konečně dočkal oficiálního spuštění.

Klíč k budoucnosti umělé inteligence může být v rukou Západu i Východu. Foto: Freepik
Některé východní země však umělou inteligenci bez okolků využívají i ve vojenském průmyslu. Příkladem je Severní Korea, která podle všeho testuje sebevražedné létající drony řízené AI. Podle zpráv Státní tiskové agentury (KCNA) tamní vůdce Kim Čong-un osobně zkontroloval modernizované stroje schopné odhalovat taktické cíle a nepřátelské aktivity na zemi i na moři. Vzhledem k tomu, že Severní Korea má ve svém vlastnictví i jaderné hlavice, může být tato technologie v rukou Kim Čong-una skutečně smrtící.
NVIDIA představila AI, která dokáže učit roboty v simulovaném prostředí
Po nedávném představení modelů s pokročilým uvažováním se NVIDIA tentokrát pochlubila s dalším AI nástrojem, který lze využít použít k tréninku robotů na základě simulace. Nový LLM nazvaný Cosmos-Transfer 1 je určen pro robotický hardware s fyzickou umělou inteligencí. Jedná se o open source s povolenou licencí, informace o modelu jsou pak veřejně k dispozici na portále arxiv.org.

Roboti mohou díky umělé inteligenci od společnosti NVIDIA trénovat ve vlastních simulacích. Foto: Se souhlasem NVIDIA
Podle společnosti NVIDIA budou mít uživatelé nad generovanými simulacemi maximální kontrolu, a budou tak moci vytvářet celé digitální světy, ve kterých se roboti budou učit pohybovat. Prostředí bude navíc možné generovat v reálném čase, a stroje se tak mohou naučit i včasné reakce na aktuální změny. Model umělé inteligence byl testován na čipových sadách NVIDIA řady Blackwell a Hopper a odvozování probíhalo v operačním systému Linux.
Apple údajně uvažuje o tom, že by ze svých hodinek udělal nositelné AI zařízení
Apple podle všeho plánuje do svých hodinek Apple Watch integrovat fotoaparáty, a učinit tak z nich nositelné zařízení s pokročilými senzorickými schopnostmi. Vyplývá to z vyjádření experta na technologie Marka Gurmana z agentury Bloomberg, který se o své dedukce podělil ve svém zpravodaji Power On.

Do Apple Watch by v budoucnu mohla přibýt AI kamera snímající okolí. Zůstane jen u spekulací? Foto: Pixabay
Apple Watch by se tak v budoucnosti mohly naučit skenovat objekty v okolí pomocí kamery umístěné v blízkosti korunky a bočního tlačítka. V praxi by tak stačilo, aby uživatel namířil hodinky na předmět zájmu, a hodinky by si samy načetly informace o objektu. Podle zprávy by se tak naplnila ambice společnosti mít nositelné zařízení s umělou inteligencí, které „vidí okolní svět a poskytuje relevantní informace“. Technologie by nejspíš narazila na poměrně zásadní omezení spojená zejména s rozměry samotných hodinek, Gurman však tvrdí, že některá z nich by mělo být možné překonat. Uvidíme tedy, zda-li se o této technologii v blízké budoucnosti dozvíme víc, třeba i přímo od Applu.
Zdroje: