Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Google DeepMind představil Genie, umělou inteligenci (AI) schopnou generovat interaktivní videohry z jednoduchého textového zadání nebo obrázku. Jestli jsme si zvykli, že vývoj her doposud znamenal tisíce hodin práce vývojářů a obrovské rozpočty, situace možná brzy bude úplně jiná. Genie funguje na fascinujícím principu, který se vám v článku pokusíme vysvětlit.

Model Genie byl trénován na 200 000 hodinách videí z videoher získaných z internetu. To umožnilo AI pochopit a naučit se základní principy a dynamiku her, aniž by jí muselo být vysvětleno, že má něco nějak konkrétně vypadat. AI se zkrátka naučila, jak běžně hry vypadají a co se v určitých situacích děje nebo může dít. Výsledkem je umělá inteligence fungující jakožto jakási univerzální konzole s univerzální hrou, která může vypadat přesně podle vašich představ.

K čemu je to celé dobré? Představte si, že máte knihu, ve které se obrázky a příběhy mění pokaždé, když pomyslíte na to, co byste právě chtěli dělat.

Jak pochopit složité fungování AI generující hry? Představte si Dračí doupě

Jedním z klíčových prvků, které Genie umožňují generovat hratelné hry, je jeho architektura stavějící na trojici hlavních prvků, které výzkumníci z Googlu nazývají – latentní akční model, tokenizátor videa a model dynamiky. Zde to začíná být trošku komplikované, ale pokusíme se vám to vysvětlit zjednodušeně.

Obrázek: Genie od Google DeepMind: Umělá inteligence tvoří z obrázků hratelné videohry

Umělé inteligenci stačí nahrát obrázek a ona z něj vytvoří hratelnou hru. Jak ukazují videa, výsledky jsou překvapivě dobré. Foto: Se souhlasem Google Deepmind

Latentní akční model AI Genie se učí odvozovat, co se na scéně mezi jednotlivými snímky změnilo bez toho, aniž by mu to někdo musel sdělit. Model sleduje, co se děje ve videích z her – například jak se postava pohybuje z místa na místo – a učí se, jak tyto akce vytvořit. To umožňuje hráčům ovládat postavy ve hře, kterou Genie vytvořil a interagovat s vygenerovaným světem.

Další důležitý prvek je tokenizátor videa, který funguje jako překladač, který převádí dlouhá videa plná složitých dějů na jednoduchý jazyk plný malých, snadno pochopitelných dějů. Tyto zjednodušené dílky pomáhají Genie pochopit a pamatovat si, co se ve videu děje, aby mohl tvořit hry, které jsou podobné tomu, co viděl. Je to jako když shrnete dlouhý příběh do pár jednoduchých vět, abyste si ho lépe zapamatovali.

Můžete hrát hry, které nikdo před vámi ani po vás nehrál

Posledním dílkem skládačky je pak model dynamiky, který se snaží „předpovědět budoucnost“. Používá informace z tokenizátoru, aby odhadl, co se ve vytvářené hře stane dál. To znamená, že když hrajete hru generovanou Genie, svět se bude vyvíjet a reagovat na vaše akce prakticky v reálném čase. Ani AI předem neví jak budete reagovat a tedy jak bude další pokračování hry vypadat. Zjednodušeně řečeno vlastně žádná hra a její finální podoba předem neexistuje a vše se vytváří za pochodu. Asi jako když hrajete Dračí doupě s kamarády.

I když to zní jako sci-fi, je to aktuálně dostupná technologie, která nám ukazuje, jak moc daleko jsme došli v pochopení a tvorbě umělé inteligence. Potvrzuje to i nedávno představený model Sora od OpenAI, který dokáže generovat komplexní videa k nerozeznání od reality. V budoucnu bychom se tak mohli dočkat např. seriálů a filmů na míru každému z nás.

Ačkoliv Genie aktuálně generuje hry pouze s frekvencí jednoho snímku za sekundu (1 FPS), je nutné chápat, že je tato technologie na samotném začátku svého vývoje. Genie je zatím k dispozici pouze pro výzkumné účely, ale už nyní otevírá pomyslné dveře k budoucnosti, kde si bude moci každý z nás vytvořit svůj vlastní virtuální svět.

Vedoucí projektu Genie věří, že tento pokrok je slibným dílkem pro vývoj modelů pro umělou obecnou inteligenci (AGI). To je ostatně cílem laboratoří Google Deepmind: vytvořit AI, která by měla schopnosti srovnatelné s lidskou inteligencí a mohla by se uplatnit v širokém spektru situací.

Zdroj: Redakce inSmart.cz, Google Deepmind

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: AI v rukou generace Z: Čeští studenti vymysleli brýle pro nevidomé a interaktivní čtečku knih
AI v rukou generace Z: Čeští studenti vymysleli brýle pro nevidomé a interaktivní čtečku knih
Obrázek: Vědci vyvinuli natahovací solární panel. Napnutím lze zvětšit jeho plochu o polovinu
Vědci vyvinuli natahovací solární panel. Napnutím lze zvětšit jeho plochu o polovinu
Obrázek: Klein Vision AirCar: Cesta létajícím vozem původem ze Slovenska je futuristickým zážitkem
Klein Vision AirCar: Cesta létajícím vozem původem ze Slovenska je futuristickým zážitkem
Obrázek: Silnice jsou kvůli nim prý nebezpečnější. Senátoři varují před autonomními vozidly a asistenty pro řidiče
Silnice jsou kvůli nim prý nebezpečnější. Senátoři varují před autonomními vozidly a asistenty pro řidiče
Obrázek: Tvrdí cizí lidé, že jim volalo vaše číslo? Poradíme, jak poznat podvodný spoofing
Tvrdí cizí lidé, že jim volalo vaše číslo? Poradíme, jak poznat podvodný spoofing
Obrázek: Podvodníci mohou volat z vašeho telefonního čísla i čísla banky. Proč operátoři nezasáhnou?
Podvodníci mohou volat z vašeho telefonního čísla i čísla banky. Proč operátoři nezasáhnou?
Obrázek: Máte doma nefunkční GPS lokátor od Invoxia? Nyní bude v ČR opět fungovat
Máte doma nefunkční GPS lokátor od Invoxia? Nyní bude v ČR opět fungovat
Obrázek: Tesla v ČR otevřela své rychlonabíječky pro všechny elektromobily. Jak nabíjet na Superchargeru?
Tesla v ČR otevřela své rychlonabíječky pro všechny elektromobily. Jak nabíjet na Superchargeru?