Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

OpenAI dnes překvapila uvedením modelu Sora schopného generovat videa. Zveřejněná videa vypadají překvapivě dobře a jsou na hranici rozeznatelnosti od reality či od děl profesionálních tvůrců. Vše, co pro vytvoření videa budete potřebovat, je zadat textové zadání a AI již vše vytvoří sama. Model Sora zvládá vytvářet videa dlouhá 60 sekund a scénu sám domyslí tak, aby působila realisticky.

Umělá inteligence schopná generovat text či obrázky je tu s námi už několik let, a za tu dobu udělala obrovský pokrok až do stavu, kdy jsou její výstupy k nerozeznání od reality. Co zatím pokulhávalo je generování videí, které mělo k dokonalosti daleko. OpenAI dnes představením modelu Sora zcela změnilo pravidla hry. Kvalita videí, která dokáže nová AI generovat, je překvapivě dobrá.

Vývoj umělé inteligence v posledních měsících a letech naznačuje, že hranice mezi digitálně generovaným obsahem a realitou postupně mizí, a brzy již nebude možné rozeznat rozdíly.

Jak např. vypadalo zadání pro AI, na jehož základě vzniklo video výše? Prompt zněl v překladu takto: „Krásné zasněžené a rušné Tokio. Kamera se pohybuje rušnou městskou ulicí a sleduje pár, který si užívá krásného zasněženého počasí a nakupuje v okolních stáncích. Spolu se sněhovými vločkami poletují ve větru nádherné okvětní lístky sakur.

Sora se inspirovala u ChatGPT i generátorů obrázků

Model Sora je postaven na difuzním modelu, který dokáže generovat celá videa najednou nebo rozšiřovat již vygenerovaná videa, aby byla delší. Použití architektury transformer, podobně jako u modelů GPT, modelu Sora umožňuje dosáhnout dobrých výsledků při škálování.

Obrázek: Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

Scény již mohou být opravdu komplexní. Ještě před několika měsíci vypadala videa z AI generátorů typu Kaiber či BHuman spíše jako pochybné halucinace. Nyní už jsme jen malý krok od doby postfaktické. Foto: Se souhlasem OpenAI

Model je schopen generovat komplexní scény s více postavami, specifickými typy pohybu a přesnými detaily předmětů a pozadí. Díky hlubokému porozumění jazyku dokáže model Sora přesně interpretovat textové pokyny a generovat postavy, které vyjadřují reálné a živé emoce. Unikátní je také schopnost modelu vytvářet v rámci jednoho generovaného videa více záběrů, které přesně zachovávají podobu postav a vizuální styl.

Bezpečnostní opatření

Před uvolněním modelu Sora do produktů OpenAI jsou podle společnosti přijímána důležitá bezpečnostní opatření. Tvůrci spolupracují s odborníky na dezinformace, deepfakes a nenávistný obsah, které by bez vestavěných omezení bylo snadné s podobným nástrojem generovat. Kromě toho na straně OpenAI dochází k vývoji nástroje pro detekci závadného obsahu, včetně klasifikátoru schopného rozpoznat, zda bylo video generováno právě modelem Sora.

Až bude nástroj uvolněn pro veřejnost, bude textový klasifikátor kontrolovat a odmítat textové vstupy, které porušují pravidla používání, například požadavky na extrémní násilí, sexuální obsah, nenávistné obrázky, podobu celebrit nebo duševní vlastnictví jiných. Rozvinuté obrazové klasifikátory dokáží zkontrolovat každý snímek vygenerovaného videa, aby se zajistilo, že splňuje pravidla používání.

K čemu bude model použitelný?

Představení modelu Sora otevírá nové možnosti pro vizuální umělce, designéry a filmaře, poskytuje jim nástroj pro rozšíření jejich kreativity a inovace v jejich oborech. Zároveň však vyvstávají otázky týkající se možného zneužití technologie k šíření dezinformací nebo vytváření zavádějícího obsahu.

Využití technologie si umíme dobře představit např. v reklamním průmyslu, kde AI ohromně sníží náklady na produkci reklam a zajímavého obsahu. Pokud chcete vidět více fascinujících ukázek vygenerovaných videí, navštivte stránky https://openai.com/sora.

Spolupráce s politiky, lektory a umělci po celém světě je klíčová pro pochopení obav a identifikaci pozitivních využití této nové technologie. „Přestože byl model Sora podroben rozsáhlému výzkumu a testování, nelze předpovědět všechny způsoby, jakými bude technologie využívána nebo zneužívána,“ zmiňují tvůrci.

Kdy a za jakých podmínek se model Sora dostane do rukou veřejnosti zatím OpenAI neuvedla.

Zdroj: OpenAI, Sora

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Máte chaos ve fotkách? AI NVIDIA ChatRTX najde v PC obrázky podle textového popisu
Máte chaos ve fotkách? AI NVIDIA ChatRTX najde v PC obrázky podle textového popisu
Obrázek: Nové skafandry SpaceX jsou jako ze sci-fi. V tomhle se již brzy odehraje první komerční výstup do vesmíru v historii
Nové skafandry SpaceX jsou jako ze sci-fi. V tomhle se již brzy odehraje první komerční výstup do vesmíru v historii
Obrázek: Kam o víkendu? Na největší svátek geeků. Maker Faire Prague přivítá světové Youtubery i vítěze soutěže NASA
Kam o víkendu? Na největší svátek geeků. Maker Faire Prague přivítá světové Youtubery i vítěze soutěže NASA
Obrázek: Přiznání Neuralinku: Bez problémů se klinické testy neobešly, mozkový implantát se porouchal
Přiznání Neuralinku: Bez problémů se klinické testy neobešly, mozkový implantát se porouchal
Obrázek: Kde sledovat mistrovství světa v hokeji? Online v prohlížeči, na mobilu i v PC bez internetu
Kde sledovat mistrovství světa v hokeji? Online v prohlížeči, na mobilu i v PC bez internetu
Obrázek: Jak spustit retro hry na počítači s Windows 11?
Jak spustit retro hry na počítači s Windows 11?
Obrázek: Konzole PlayStation 5 má skrytý internetový prohlížeč. Jak ho najít a spustit?
Konzole PlayStation 5 má skrytý internetový prohlížeč. Jak ho najít a spustit?
Obrázek: Tvrdí cizí lidé, že jim volalo vaše číslo? Poradíme, jak poznat podvodný spoofing
Tvrdí cizí lidé, že jim volalo vaše číslo? Poradíme, jak poznat podvodný spoofing