Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

OpenAI dnes překvapila uvedením modelu Sora schopného generovat videa. Zveřejněná videa vypadají překvapivě dobře a jsou na hranici rozeznatelnosti od reality či od děl profesionálních tvůrců. Vše, co pro vytvoření videa budete potřebovat, je zadat textové zadání a AI již vše vytvoří sama. Model Sora zvládá vytvářet videa dlouhá 60 sekund a scénu sám domyslí tak, aby působila realisticky.

Umělá inteligence schopná generovat text či obrázky je tu s námi už několik let, a za tu dobu udělala obrovský pokrok až do stavu, kdy jsou její výstupy k nerozeznání od reality. Co zatím pokulhávalo je generování videí, které mělo k dokonalosti daleko. OpenAI dnes představením modelu Sora zcela změnilo pravidla hry. Kvalita videí, která dokáže nová AI generovat, je překvapivě dobrá.

Vývoj umělé inteligence v posledních měsících a letech naznačuje, že hranice mezi digitálně generovaným obsahem a realitou postupně mizí, a brzy již nebude možné rozeznat rozdíly.

Jak např. vypadalo zadání pro AI, na jehož základě vzniklo video výše? Prompt zněl v překladu takto: „Krásné zasněžené a rušné Tokio. Kamera se pohybuje rušnou městskou ulicí a sleduje pár, který si užívá krásného zasněženého počasí a nakupuje v okolních stáncích. Spolu se sněhovými vločkami poletují ve větru nádherné okvětní lístky sakur.

Sora se inspirovala u ChatGPT i generátorů obrázků

Model Sora je postaven na difuzním modelu, který dokáže generovat celá videa najednou nebo rozšiřovat již vygenerovaná videa, aby byla delší. Použití architektury transformer, podobně jako u modelů GPT, modelu Sora umožňuje dosáhnout dobrých výsledků při škálování.

Obrázek: Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

Scény již mohou být opravdu komplexní. Ještě před několika měsíci vypadala videa z AI generátorů typu Kaiber či BHuman spíše jako pochybné halucinace. Nyní už jsme jen malý krok od doby postfaktické. Foto: Se souhlasem OpenAI

Model je schopen generovat komplexní scény s více postavami, specifickými typy pohybu a přesnými detaily předmětů a pozadí. Díky hlubokému porozumění jazyku dokáže model Sora přesně interpretovat textové pokyny a generovat postavy, které vyjadřují reálné a živé emoce. Unikátní je také schopnost modelu vytvářet v rámci jednoho generovaného videa více záběrů, které přesně zachovávají podobu postav a vizuální styl.

Bezpečnostní opatření

Před uvolněním modelu Sora do produktů OpenAI jsou podle společnosti přijímána důležitá bezpečnostní opatření. Tvůrci spolupracují s odborníky na dezinformace, deepfakes a nenávistný obsah, které by bez vestavěných omezení bylo snadné s podobným nástrojem generovat. Kromě toho na straně OpenAI dochází k vývoji nástroje pro detekci závadného obsahu, včetně klasifikátoru schopného rozpoznat, zda bylo video generováno právě modelem Sora.

Až bude nástroj uvolněn pro veřejnost, bude textový klasifikátor kontrolovat a odmítat textové vstupy, které porušují pravidla používání, například požadavky na extrémní násilí, sexuální obsah, nenávistné obrázky, podobu celebrit nebo duševní vlastnictví jiných. Rozvinuté obrazové klasifikátory dokáží zkontrolovat každý snímek vygenerovaného videa, aby se zajistilo, že splňuje pravidla používání.

K čemu bude model použitelný?

Představení modelu Sora otevírá nové možnosti pro vizuální umělce, designéry a filmaře, poskytuje jim nástroj pro rozšíření jejich kreativity a inovace v jejich oborech. Zároveň však vyvstávají otázky týkající se možného zneužití technologie k šíření dezinformací nebo vytváření zavádějícího obsahu.

Využití technologie si umíme dobře představit např. v reklamním průmyslu, kde AI ohromně sníží náklady na produkci reklam a zajímavého obsahu. Pokud chcete vidět více fascinujících ukázek vygenerovaných videí, navštivte stránky https://openai.com/sora.

Spolupráce s politiky, lektory a umělci po celém světě je klíčová pro pochopení obav a identifikaci pozitivních využití této nové technologie. „Přestože byl model Sora podroben rozsáhlému výzkumu a testování, nelze předpovědět všechny způsoby, jakými bude technologie využívána nebo zneužívána,“ zmiňují tvůrci.

Kdy a za jakých podmínek se model Sora dostane do rukou veřejnosti zatím OpenAI neuvedla.

Zdroj: OpenAI, Sora

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Obrázek: Nejlepší telefony v Česku: Jaký vybrat, pokud chcete to nejlepší?
Nejlepší telefony v Česku: Jaký vybrat, pokud chcete to nejlepší?
Obrázek: Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Obrázek: Recenze IQOS ILUMA i PRIME: Smartphone mezi nahřívanými tabákovými výrobky
Recenze IQOS ILUMA i PRIME: Smartphone mezi nahřívanými tabákovými výrobky
Obrázek: Konec jedné éry: Muskova společnost SpaceX se připravuje na likvidaci Mezinárodní vesmírné stanice
Konec jedné éry: Muskova společnost SpaceX se připravuje na likvidaci Mezinárodní vesmírné stanice
Obrázek: Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Štve vás umístění tlačítka Start ve Windows 11 na střed? Takto to můžete napravit
Obrázek: Jak vytěžit z Black Friday nabídky Samsungu co největší slevu? Poradíme, jak fungují výkupy a cashback
Jak vytěžit z Black Friday nabídky Samsungu co největší slevu? Poradíme, jak fungují výkupy a cashback
Obrázek: Black Friday letos odstartoval extrémně brzy: Jak si ověřit, že je sleva skutečná?
Black Friday letos odstartoval extrémně brzy: Jak si ověřit, že je sleva skutečná?
Obrázek: Jak vyfotit kometu mobilem? 5 tipů, jak dosáhnout skvělých výsledků
Jak vyfotit kometu mobilem? 5 tipů, jak dosáhnout skvělých výsledků