Google DeepMind představil Genie, umělou inteligenci (AI) schopnou generovat interaktivní videohry z jednoduchého textového zadání nebo obrázku. Jestli jsme si zvykli, že vývoj her doposud znamenal tisíce hodin práce vývojářů a obrovské rozpočty, situace možná brzy bude úplně jiná. Genie funguje na fascinujícím principu, který se vám v článku pokusíme vysvětlit.
Model Genie byl trénován na 200 000 hodinách videí z videoher získaných z internetu. To umožnilo AI pochopit a naučit se základní principy a dynamiku her, aniž by jí muselo být vysvětleno, že má něco nějak konkrétně vypadat. AI se zkrátka naučila, jak běžně hry vypadají a co se v určitých situacích děje nebo může dít. Výsledkem je umělá inteligence fungující jakožto jakási univerzální konzole s univerzální hrou, která může vypadat přesně podle vašich představ.
Rather than adding inductive biases, we focus on scale. We use a dataset of >200k hours of videos from 2D platformers and train an 11B world model. In an unsupervised way, Genie learns diverse latent actions that control characters in a consistent manner. pic.twitter.com/71a3iuAGZA
— Tim Rocktäschel (@_rockt) February 26, 2024
K čemu je to celé dobré? Představte si, že máte knihu, ve které se obrázky a příběhy mění pokaždé, když pomyslíte na to, co byste právě chtěli dělat.
Jak pochopit složité fungování AI generující hry? Představte si Dračí doupě
Jedním z klíčových prvků, které Genie umožňují generovat hratelné hry, je jeho architektura stavějící na trojici hlavních prvků, které výzkumníci z Googlu nazývají – latentní akční model, tokenizátor videa a model dynamiky. Zde to začíná být trošku komplikované, ale pokusíme se vám to vysvětlit zjednodušeně.
Latentní akční model AI Genie se učí odvozovat, co se na scéně mezi jednotlivými snímky změnilo bez toho, aniž by mu to někdo musel sdělit. Model sleduje, co se děje ve videích z her – například jak se postava pohybuje z místa na místo – a učí se, jak tyto akce vytvořit. To umožňuje hráčům ovládat postavy ve hře, kterou Genie vytvořil a interagovat s vygenerovaným světem.
Další důležitý prvek je tokenizátor videa, který funguje jako překladač, který převádí dlouhá videa plná složitých dějů na jednoduchý jazyk plný malých, snadno pochopitelných dějů. Tyto zjednodušené dílky pomáhají Genie pochopit a pamatovat si, co se ve videu děje, aby mohl tvořit hry, které jsou podobné tomu, co viděl. Je to jako když shrnete dlouhý příběh do pár jednoduchých vět, abyste si ho lépe zapamatovali.
Můžete hrát hry, které nikdo před vámi ani po vás nehrál
Posledním dílkem skládačky je pak model dynamiky, který se snaží „předpovědět budoucnost“. Používá informace z tokenizátoru, aby odhadl, co se ve vytvářené hře stane dál. To znamená, že když hrajete hru generovanou Genie, svět se bude vyvíjet a reagovat na vaše akce prakticky v reálném čase. Ani AI předem neví jak budete reagovat a tedy jak bude další pokračování hry vypadat. Zjednodušeně řečeno vlastně žádná hra a její finální podoba předem neexistuje a vše se vytváří za pochodu. Asi jako když hrajete Dračí doupě s kamarády.
I když to zní jako sci-fi, je to aktuálně dostupná technologie, která nám ukazuje, jak moc daleko jsme došli v pochopení a tvorbě umělé inteligence. Potvrzuje to i nedávno představený model Sora od OpenAI, který dokáže generovat komplexní videa k nerozeznání od reality. V budoucnu bychom se tak mohli dočkat např. seriálů a filmů na míru každému z nás.
Ačkoliv Genie aktuálně generuje hry pouze s frekvencí jednoho snímku za sekundu (1 FPS), je nutné chápat, že je tato technologie na samotném začátku svého vývoje. Genie je zatím k dispozici pouze pro výzkumné účely, ale už nyní otevírá pomyslné dveře k budoucnosti, kde si bude moci každý z nás vytvořit svůj vlastní virtuální svět.
Genie: Generative Interactive Environments
abs: https://t.co/sY6syP1n6z
project website: https://t.co/ZuKmK1coLcThis paper from Google DeepMind introduces an 11B foundation world model called Genie, trained on unlabelled Internet videos of 2d Platformer games.
Genie has three… pic.twitter.com/UGlxFCLVFc
— Tanishq Mathew Abraham, Ph.D. (@iScienceLuvr) February 26, 2024
Vedoucí projektu Genie věří, že tento pokrok je slibným dílkem pro vývoj modelů pro umělou obecnou inteligenci (AGI). To je ostatně cílem laboratoří Google Deepmind: vytvořit AI, která by měla schopnosti srovnatelné s lidskou inteligencí a mohla by se uplatnit v širokém spektru situací.
Zdroj: Redakce inSmart.cz, Google Deepmind