Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Google DeepMind představil Genie, umělou inteligenci (AI) schopnou generovat interaktivní videohry z jednoduchého textového zadání nebo obrázku. Jestli jsme si zvykli, že vývoj her doposud znamenal tisíce hodin práce vývojářů a obrovské rozpočty, situace možná brzy bude úplně jiná. Genie funguje na fascinujícím principu, který se vám v článku pokusíme vysvětlit.

Model Genie byl trénován na 200 000 hodinách videí z videoher získaných z internetu. To umožnilo AI pochopit a naučit se základní principy a dynamiku her, aniž by jí muselo být vysvětleno, že má něco nějak konkrétně vypadat. AI se zkrátka naučila, jak běžně hry vypadají a co se v určitých situacích děje nebo může dít. Výsledkem je umělá inteligence fungující jakožto jakási univerzální konzole s univerzální hrou, která může vypadat přesně podle vašich představ.

K čemu je to celé dobré? Představte si, že máte knihu, ve které se obrázky a příběhy mění pokaždé, když pomyslíte na to, co byste právě chtěli dělat.

Jak pochopit složité fungování AI generující hry? Představte si Dračí doupě

Jedním z klíčových prvků, které Genie umožňují generovat hratelné hry, je jeho architektura stavějící na trojici hlavních prvků, které výzkumníci z Googlu nazývají – latentní akční model, tokenizátor videa a model dynamiky. Zde to začíná být trošku komplikované, ale pokusíme se vám to vysvětlit zjednodušeně.

Obrázek: Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Umělé inteligenci stačí nahrát obrázek a ona z něj vytvoří hratelnou hru. Jak ukazují videa, výsledky jsou překvapivě dobré. Foto: Se souhlasem Google Deepmind

Latentní akční model AI Genie se učí odvozovat, co se na scéně mezi jednotlivými snímky změnilo bez toho, aniž by mu to někdo musel sdělit. Model sleduje, co se děje ve videích z her – například jak se postava pohybuje z místa na místo – a učí se, jak tyto akce vytvořit. To umožňuje hráčům ovládat postavy ve hře, kterou Genie vytvořil a interagovat s vygenerovaným světem.

Další důležitý prvek je tokenizátor videa, který funguje jako překladač, který převádí dlouhá videa plná složitých dějů na jednoduchý jazyk plný malých, snadno pochopitelných dějů. Tyto zjednodušené dílky pomáhají Genie pochopit a pamatovat si, co se ve videu děje, aby mohl tvořit hry, které jsou podobné tomu, co viděl. Je to jako když shrnete dlouhý příběh do pár jednoduchých vět, abyste si ho lépe zapamatovali.

Můžete hrát hry, které nikdo před vámi ani po vás nehrál

Posledním dílkem skládačky je pak model dynamiky, který se snaží „předpovědět budoucnost“. Používá informace z tokenizátoru, aby odhadl, co se ve vytvářené hře stane dál. To znamená, že když hrajete hru generovanou Genie, svět se bude vyvíjet a reagovat na vaše akce prakticky v reálném čase. Ani AI předem neví jak budete reagovat a tedy jak bude další pokračování hry vypadat. Zjednodušeně řečeno vlastně žádná hra a její finální podoba předem neexistuje a vše se vytváří za pochodu. Asi jako když hrajete Dračí doupě s kamarády.

I když to zní jako sci-fi, je to aktuálně dostupná technologie, která nám ukazuje, jak moc daleko jsme došli v pochopení a tvorbě umělé inteligence. Potvrzuje to i nedávno představený model Sora od OpenAI, který dokáže generovat komplexní videa k nerozeznání od reality. V budoucnu bychom se tak mohli dočkat např. seriálů a filmů na míru každému z nás.

Ačkoliv Genie aktuálně generuje hry pouze s frekvencí jednoho snímku za sekundu (1 FPS), je nutné chápat, že je tato technologie na samotném začátku svého vývoje. Genie je zatím k dispozici pouze pro výzkumné účely, ale už nyní otevírá pomyslné dveře k budoucnosti, kde si bude moci každý z nás vytvořit svůj vlastní virtuální svět.

Vedoucí projektu Genie věří, že tento pokrok je slibným dílkem pro vývoj modelů pro umělou obecnou inteligenci (AGI). To je ostatně cílem laboratoří Google Deepmind: vytvořit AI, která by měla schopnosti srovnatelné s lidskou inteligencí a mohla by se uplatnit v širokém spektru situací.

Zdroj: Redakce inSmart.cz, Google Deepmind

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Obrázek: Nejlepší telefony v Česku: Jaký vybrat, pokud chcete to nejlepší?
Nejlepší telefony v Česku: Jaký vybrat, pokud chcete to nejlepší?
Obrázek: Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Obrázek: Recenze IQOS ILUMA i PRIME: Smartphone mezi nahřívanými tabákovými výrobky
Recenze IQOS ILUMA i PRIME: Smartphone mezi nahřívanými tabákovými výrobky
Obrázek: Konec jedné éry: Muskova společnost SpaceX se připravuje na likvidaci Mezinárodní vesmírné stanice
Konec jedné éry: Muskova společnost SpaceX se připravuje na likvidaci Mezinárodní vesmírné stanice
Obrázek: Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Obrázek: Jak vytěžit z Black Friday nabídky Samsungu co největší slevu? Poradíme, jak fungují výkupy a cashback
Jak vytěžit z Black Friday nabídky Samsungu co největší slevu? Poradíme, jak fungují výkupy a cashback
Obrázek: Black Friday letos odstartoval extrémně brzy: Jak si ověřit, že je sleva skutečná?
Black Friday letos odstartoval extrémně brzy: Jak si ověřit, že je sleva skutečná?
Obrázek: Jak vyfotit kometu mobilem? 5 tipů, jak dosáhnout skvělých výsledků
Jak vyfotit kometu mobilem? 5 tipů, jak dosáhnout skvělých výsledků