Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Google DeepMind představil Genie, umělou inteligenci (AI) schopnou generovat interaktivní videohry z jednoduchého textového zadání nebo obrázku. Jestli jsme si zvykli, že vývoj her doposud znamenal tisíce hodin práce vývojářů a obrovské rozpočty, situace možná brzy bude úplně jiná. Genie funguje na fascinujícím principu, který se vám v článku pokusíme vysvětlit.

Model Genie byl trénován na 200 000 hodinách videí z videoher získaných z internetu. To umožnilo AI pochopit a naučit se základní principy a dynamiku her, aniž by jí muselo být vysvětleno, že má něco nějak konkrétně vypadat. AI se zkrátka naučila, jak běžně hry vypadají a co se v určitých situacích děje nebo může dít. Výsledkem je umělá inteligence fungující jakožto jakási univerzální konzole s univerzální hrou, která může vypadat přesně podle vašich představ.

K čemu je to celé dobré? Představte si, že máte knihu, ve které se obrázky a příběhy mění pokaždé, když pomyslíte na to, co byste právě chtěli dělat.

Jak pochopit složité fungování AI generující hry? Představte si Dračí doupě

Jedním z klíčových prvků, které Genie umožňují generovat hratelné hry, je jeho architektura stavějící na trojici hlavních prvků, které výzkumníci z Googlu nazývají – latentní akční model, tokenizátor videa a model dynamiky. Zde to začíná být trošku komplikované, ale pokusíme se vám to vysvětlit zjednodušeně.

Obrázek: Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Umělé inteligenci stačí nahrát obrázek a ona z něj vytvoří hratelnou hru. Jak ukazují videa, výsledky jsou překvapivě dobré. Foto: Se souhlasem Google Deepmind

Latentní akční model AI Genie se učí odvozovat, co se na scéně mezi jednotlivými snímky změnilo bez toho, aniž by mu to někdo musel sdělit. Model sleduje, co se děje ve videích z her – například jak se postava pohybuje z místa na místo – a učí se, jak tyto akce vytvořit. To umožňuje hráčům ovládat postavy ve hře, kterou Genie vytvořil a interagovat s vygenerovaným světem.

Další důležitý prvek je tokenizátor videa, který funguje jako překladač, který převádí dlouhá videa plná složitých dějů na jednoduchý jazyk plný malých, snadno pochopitelných dějů. Tyto zjednodušené dílky pomáhají Genie pochopit a pamatovat si, co se ve videu děje, aby mohl tvořit hry, které jsou podobné tomu, co viděl. Je to jako když shrnete dlouhý příběh do pár jednoduchých vět, abyste si ho lépe zapamatovali.

Můžete hrát hry, které nikdo před vámi ani po vás nehrál

Posledním dílkem skládačky je pak model dynamiky, který se snaží „předpovědět budoucnost“. Používá informace z tokenizátoru, aby odhadl, co se ve vytvářené hře stane dál. To znamená, že když hrajete hru generovanou Genie, svět se bude vyvíjet a reagovat na vaše akce prakticky v reálném čase. Ani AI předem neví jak budete reagovat a tedy jak bude další pokračování hry vypadat. Zjednodušeně řečeno vlastně žádná hra a její finální podoba předem neexistuje a vše se vytváří za pochodu. Asi jako když hrajete Dračí doupě s kamarády.

I když to zní jako sci-fi, je to aktuálně dostupná technologie, která nám ukazuje, jak moc daleko jsme došli v pochopení a tvorbě umělé inteligence. Potvrzuje to i nedávno představený model Sora od OpenAI, který dokáže generovat komplexní videa k nerozeznání od reality. V budoucnu bychom se tak mohli dočkat např. seriálů a filmů na míru každému z nás.

Ačkoliv Genie aktuálně generuje hry pouze s frekvencí jednoho snímku za sekundu (1 FPS), je nutné chápat, že je tato technologie na samotném začátku svého vývoje. Genie je zatím k dispozici pouze pro výzkumné účely, ale už nyní otevírá pomyslné dveře k budoucnosti, kde si bude moci každý z nás vytvořit svůj vlastní virtuální svět.

Vedoucí projektu Genie věří, že tento pokrok je slibným dílkem pro vývoj modelů pro umělou obecnou inteligenci (AGI). To je ostatně cílem laboratoří Google Deepmind: vytvořit AI, která by měla schopnosti srovnatelné s lidskou inteligencí a mohla by se uplatnit v širokém spektru situací.

Zdroj: Redakce inSmart.cz, Google Deepmind

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Svěřit osud lidstva umělé inteligenci? Jaderné zbraně jen pod lidskou kontrolou, zavázaly se USA se spojenci
Svěřit osud lidstva umělé inteligenci? Jaderné zbraně jen pod lidskou kontrolou, zavázaly se USA se spojenci
Obrázek: Apple dnes odhalí novou řadu prémiových iPadů. Co už víme a kde konferenci sledovat?
Apple dnes odhalí novou řadu prémiových iPadů. Co už víme a kde konferenci sledovat?
Obrázek: Automatizace v praxi: Amazon má ve skladech armádu 750 000 robotů, lidskou pracovní sílu prý nevytlačují
Automatizace v praxi: Amazon má ve skladech armádu 750 000 robotů, lidskou pracovní sílu prý nevytlačují
Obrázek: Česko si nechává ujet vlak. Cena lithia klesá, těžba se brzy nemusí vyplatit
Česko si nechává ujet vlak. Cena lithia klesá, těžba se brzy nemusí vyplatit
Obrázek: Jak spustit retro hry na počítači s Windows 11?
Jak spustit retro hry na počítači s Windows 11?
Obrázek: Konzole PlayStation 5 má skrytý internetový prohlížeč. Jak ho najít a spustit?
Konzole PlayStation 5 má skrytý internetový prohlížeč. Jak ho najít a spustit?
Obrázek: Tvrdí cizí lidé, že jim volalo vaše číslo? Poradíme, jak poznat podvodný spoofing
Tvrdí cizí lidé, že jim volalo vaše číslo? Poradíme, jak poznat podvodný spoofing
Obrázek: Podvodníci mohou volat z vašeho telefonního čísla i čísla banky. Proč operátoři nezasáhnou?
Podvodníci mohou volat z vašeho telefonního čísla i čísla banky. Proč operátoři nezasáhnou?