Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

OpenAI dnes překvapila uvedením modelu Sora schopného generovat videa. Zveřejněná videa vypadají překvapivě dobře a jsou na hranici rozeznatelnosti od reality či od děl profesionálních tvůrců. Vše, co pro vytvoření videa budete potřebovat, je zadat textové zadání a AI již vše vytvoří sama. Model Sora zvládá vytvářet videa dlouhá 60 sekund a scénu sám domyslí tak, aby působila realisticky.

Umělá inteligence schopná generovat text či obrázky je tu s námi už několik let, a za tu dobu udělala obrovský pokrok až do stavu, kdy jsou její výstupy k nerozeznání od reality. Co zatím pokulhávalo je generování videí, které mělo k dokonalosti daleko. OpenAI dnes představením modelu Sora zcela změnilo pravidla hry. Kvalita videí, která dokáže nová AI generovat, je překvapivě dobrá.

Vývoj umělé inteligence v posledních měsících a letech naznačuje, že hranice mezi digitálně generovaným obsahem a realitou postupně mizí, a brzy již nebude možné rozeznat rozdíly.

Jak např. vypadalo zadání pro AI, na jehož základě vzniklo video výše? Prompt zněl v překladu takto: „Krásné zasněžené a rušné Tokio. Kamera se pohybuje rušnou městskou ulicí a sleduje pár, který si užívá krásného zasněženého počasí a nakupuje v okolních stáncích. Spolu se sněhovými vločkami poletují ve větru nádherné okvětní lístky sakur.

Sora se inspirovala u ChatGPT i generátorů obrázků

Model Sora je postaven na difuzním modelu, který dokáže generovat celá videa najednou nebo rozšiřovat již vygenerovaná videa, aby byla delší. Použití architektury transformer, podobně jako u modelů GPT, modelu Sora umožňuje dosáhnout dobrých výsledků při škálování.

Obrázek: Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

Scény již mohou být opravdu komplexní. Ještě před několika měsíci vypadala videa z AI generátorů typu Kaiber či BHuman spíše jako pochybné halucinace. Nyní už jsme jen malý krok od doby postfaktické. Foto: Se souhlasem OpenAI

Model je schopen generovat komplexní scény s více postavami, specifickými typy pohybu a přesnými detaily předmětů a pozadí. Díky hlubokému porozumění jazyku dokáže model Sora přesně interpretovat textové pokyny a generovat postavy, které vyjadřují reálné a živé emoce. Unikátní je také schopnost modelu vytvářet v rámci jednoho generovaného videa více záběrů, které přesně zachovávají podobu postav a vizuální styl.

Bezpečnostní opatření

Před uvolněním modelu Sora do produktů OpenAI jsou podle společnosti přijímána důležitá bezpečnostní opatření. Tvůrci spolupracují s odborníky na dezinformace, deepfakes a nenávistný obsah, které by bez vestavěných omezení bylo snadné s podobným nástrojem generovat. Kromě toho na straně OpenAI dochází k vývoji nástroje pro detekci závadného obsahu, včetně klasifikátoru schopného rozpoznat, zda bylo video generováno právě modelem Sora.

Až bude nástroj uvolněn pro veřejnost, bude textový klasifikátor kontrolovat a odmítat textové vstupy, které porušují pravidla používání, například požadavky na extrémní násilí, sexuální obsah, nenávistné obrázky, podobu celebrit nebo duševní vlastnictví jiných. Rozvinuté obrazové klasifikátory dokáží zkontrolovat každý snímek vygenerovaného videa, aby se zajistilo, že splňuje pravidla používání.

K čemu bude model použitelný?

Představení modelu Sora otevírá nové možnosti pro vizuální umělce, designéry a filmaře, poskytuje jim nástroj pro rozšíření jejich kreativity a inovace v jejich oborech. Zároveň však vyvstávají otázky týkající se možného zneužití technologie k šíření dezinformací nebo vytváření zavádějícího obsahu.

Využití technologie si umíme dobře představit např. v reklamním průmyslu, kde AI ohromně sníží náklady na produkci reklam a zajímavého obsahu. Pokud chcete vidět více fascinujících ukázek vygenerovaných videí, navštivte stránky https://openai.com/sora.

Spolupráce s politiky, lektory a umělci po celém světě je klíčová pro pochopení obav a identifikaci pozitivních využití této nové technologie. „Přestože byl model Sora podroben rozsáhlému výzkumu a testování, nelze předpovědět všechny způsoby, jakými bude technologie využívána nebo zneužívána,“ zmiňují tvůrci.

Kdy a za jakých podmínek se model Sora dostane do rukou veřejnosti zatím OpenAI neuvedla.

Zdroj: OpenAI, Sora

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Viry se maskují jako populární mobilní hry. Cílem jsou bankovní účty uživatelů Androidu
Viry se maskují jako populární mobilní hry. Cílem jsou bankovní účty uživatelů Androidu
Obrázek: Smartphone jako konzole? Ukážeme vám, jak využít POCO F6 Pro na maximum
Smartphone jako konzole? Ukážeme vám, jak využít POCO F6 Pro na maximum
Obrázek: Už žádné sankce: OPPO a Ericsson uzavřely globální dohodu o spolupráci v oblasti 5G technologií
Už žádné sankce: OPPO a Ericsson uzavřely globální dohodu o spolupráci v oblasti 5G technologií
Obrázek: Sony A1: Fotoaparát, který vyfotil kulku u hlavy Donalda Trumpa
Sony A1: Fotoaparát, který vyfotil kulku u hlavy Donalda Trumpa
Obrázek: Mýtus o dedikovaných IP adresách v e-mail marketingu: Opravdu zlepšují doručitelnost?
Mýtus o dedikovaných IP adresách v e-mail marketingu: Opravdu zlepšují doručitelnost?
Obrázek: Přijdou silné bouřky, nebo slabé přeháňky? Přesná aplikace vám to pomůže zjistit
Přijdou silné bouřky, nebo slabé přeháňky? Přesná aplikace vám to pomůže zjistit
Obrázek: Znásobte své finance s AI, nabádají podvodníci Čechy na Facebooku. Jak je nahlásit a ochránit ostatní?
Znásobte své finance s AI, nabádají podvodníci Čechy na Facebooku. Jak je nahlásit a ochránit ostatní?
Obrázek: Česko zasáhnou velmi silné bouřky: Jak ochránit elektroniku a spotřebiče před zničením bleskem?
Česko zasáhnou velmi silné bouřky: Jak ochránit elektroniku a spotřebiče před zničením bleskem?