Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Google DeepMind představil Genie, umělou inteligenci (AI) schopnou generovat interaktivní videohry z jednoduchého textového zadání nebo obrázku. Jestli jsme si zvykli, že vývoj her doposud znamenal tisíce hodin práce vývojářů a obrovské rozpočty, situace možná brzy bude úplně jiná. Genie funguje na fascinujícím principu, který se vám v článku pokusíme vysvětlit.

Model Genie byl trénován na 200 000 hodinách videí z videoher získaných z internetu. To umožnilo AI pochopit a naučit se základní principy a dynamiku her, aniž by jí muselo být vysvětleno, že má něco nějak konkrétně vypadat. AI se zkrátka naučila, jak běžně hry vypadají a co se v určitých situacích děje nebo může dít. Výsledkem je umělá inteligence fungující jakožto jakási univerzální konzole s univerzální hrou, která může vypadat přesně podle vašich představ.

K čemu je to celé dobré? Představte si, že máte knihu, ve které se obrázky a příběhy mění pokaždé, když pomyslíte na to, co byste právě chtěli dělat.

Jak pochopit složité fungování AI generující hry? Představte si Dračí doupě

Jedním z klíčových prvků, které Genie umožňují generovat hratelné hry, je jeho architektura stavějící na trojici hlavních prvků, které výzkumníci z Googlu nazývají – latentní akční model, tokenizátor videa a model dynamiky. Zde to začíná být trošku komplikované, ale pokusíme se vám to vysvětlit zjednodušeně.

Obrázek: Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Umělé inteligenci stačí nahrát obrázek a ona z něj vytvoří hratelnou hru. Jak ukazují videa, výsledky jsou překvapivě dobré. Foto: Se souhlasem Google Deepmind

Latentní akční model AI Genie se učí odvozovat, co se na scéně mezi jednotlivými snímky změnilo bez toho, aniž by mu to někdo musel sdělit. Model sleduje, co se děje ve videích z her – například jak se postava pohybuje z místa na místo – a učí se, jak tyto akce vytvořit. To umožňuje hráčům ovládat postavy ve hře, kterou Genie vytvořil a interagovat s vygenerovaným světem.

Další důležitý prvek je tokenizátor videa, který funguje jako překladač, který převádí dlouhá videa plná složitých dějů na jednoduchý jazyk plný malých, snadno pochopitelných dějů. Tyto zjednodušené dílky pomáhají Genie pochopit a pamatovat si, co se ve videu děje, aby mohl tvořit hry, které jsou podobné tomu, co viděl. Je to jako když shrnete dlouhý příběh do pár jednoduchých vět, abyste si ho lépe zapamatovali.

Můžete hrát hry, které nikdo před vámi ani po vás nehrál

Posledním dílkem skládačky je pak model dynamiky, který se snaží „předpovědět budoucnost“. Používá informace z tokenizátoru, aby odhadl, co se ve vytvářené hře stane dál. To znamená, že když hrajete hru generovanou Genie, svět se bude vyvíjet a reagovat na vaše akce prakticky v reálném čase. Ani AI předem neví jak budete reagovat a tedy jak bude další pokračování hry vypadat. Zjednodušeně řečeno vlastně žádná hra a její finální podoba předem neexistuje a vše se vytváří za pochodu. Asi jako když hrajete Dračí doupě s kamarády.

I když to zní jako sci-fi, je to aktuálně dostupná technologie, která nám ukazuje, jak moc daleko jsme došli v pochopení a tvorbě umělé inteligence. Potvrzuje to i nedávno představený model Sora od OpenAI, který dokáže generovat komplexní videa k nerozeznání od reality. V budoucnu bychom se tak mohli dočkat např. seriálů a filmů na míru každému z nás.

Ačkoliv Genie aktuálně generuje hry pouze s frekvencí jednoho snímku za sekundu (1 FPS), je nutné chápat, že je tato technologie na samotném začátku svého vývoje. Genie je zatím k dispozici pouze pro výzkumné účely, ale už nyní otevírá pomyslné dveře k budoucnosti, kde si bude moci každý z nás vytvořit svůj vlastní virtuální svět.

Vedoucí projektu Genie věří, že tento pokrok je slibným dílkem pro vývoj modelů pro umělou obecnou inteligenci (AGI). To je ostatně cílem laboratoří Google Deepmind: vytvořit AI, která by měla schopnosti srovnatelné s lidskou inteligencí a mohla by se uplatnit v širokém spektru situací.

Zdroj: Redakce inSmart.cz, Google Deepmind

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Český zdicí robot naživo: Je překvapivě pomalý, na rozdíl od lidí ale nepotřebuje odpočívat
Český zdicí robot naživo: Je překvapivě pomalý, na rozdíl od lidí ale nepotřebuje odpočívat
Obrázek: Pohled do útrob Apple Vision Pro vs. Meta Quest 3: Co ukazují snímky z CT?
Pohled do útrob Apple Vision Pro vs. Meta Quest 3: Co ukazují snímky z CT?
Obrázek: Vylepšená služba Google Find My Device najde ztracená sluchátka, lokátory i vypnuté telefony
Vylepšená služba Google Find My Device najde ztracená sluchátka, lokátory i vypnuté telefony
Obrázek: Chytré meteostanice pomáhají s výukou v pražských školách
Chytré meteostanice pomáhají s výukou v pražských školách
Obrázek: Noční fotografie s vivo X100 Pro: Jak fotit v noci se smartphonem jako profík?
Noční fotografie s vivo X100 Pro: Jak fotit v noci se smartphonem jako profík?
Obrázek: Recenze robotického vysavače TESLA RoboStar iQ700 s laserovou navigací: Čistá domácnost bez námahy?
85%
Recenze robotického vysavače TESLA RoboStar iQ700 s laserovou navigací: Čistá domácnost bez námahy?
Obrázek: Zažijte budoucnost už dnes: Nainstalujte si umělou inteligenci Gemini do telefonu s Androidem
Zažijte budoucnost už dnes: Nainstalujte si umělou inteligenci Gemini do telefonu s Androidem
Obrázek: Kde koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Kde koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024