Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

OpenAI dnes překvapila uvedením modelu Sora schopného generovat videa. Zveřejněná videa vypadají překvapivě dobře a jsou na hranici rozeznatelnosti od reality či od děl profesionálních tvůrců. Vše, co pro vytvoření videa budete potřebovat, je zadat textové zadání a AI již vše vytvoří sama. Model Sora zvládá vytvářet videa dlouhá 60 sekund a scénu sám domyslí tak, aby působila realisticky.

Umělá inteligence schopná generovat text či obrázky je tu s námi už několik let, a za tu dobu udělala obrovský pokrok až do stavu, kdy jsou její výstupy k nerozeznání od reality. Co zatím pokulhávalo je generování videí, které mělo k dokonalosti daleko. OpenAI dnes představením modelu Sora zcela změnilo pravidla hry. Kvalita videí, která dokáže nová AI generovat, je překvapivě dobrá.

Vývoj umělé inteligence v posledních měsících a letech naznačuje, že hranice mezi digitálně generovaným obsahem a realitou postupně mizí, a brzy již nebude možné rozeznat rozdíly.

Jak např. vypadalo zadání pro AI, na jehož základě vzniklo video výše? Prompt zněl v překladu takto: „Krásné zasněžené a rušné Tokio. Kamera se pohybuje rušnou městskou ulicí a sleduje pár, který si užívá krásného zasněženého počasí a nakupuje v okolních stáncích. Spolu se sněhovými vločkami poletují ve větru nádherné okvětní lístky sakur.

Sora se inspirovala u ChatGPT i generátorů obrázků

Model Sora je postaven na difuzním modelu, který dokáže generovat celá videa najednou nebo rozšiřovat již vygenerovaná videa, aby byla delší. Použití architektury transformer, podobně jako u modelů GPT, modelu Sora umožňuje dosáhnout dobrých výsledků při škálování.

Obrázek: Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

Scény již mohou být opravdu komplexní. Ještě před několika měsíci vypadala videa z AI generátorů typu Kaiber či BHuman spíše jako pochybné halucinace. Nyní už jsme jen malý krok od doby postfaktické. Foto: Se souhlasem OpenAI

Model je schopen generovat komplexní scény s více postavami, specifickými typy pohybu a přesnými detaily předmětů a pozadí. Díky hlubokému porozumění jazyku dokáže model Sora přesně interpretovat textové pokyny a generovat postavy, které vyjadřují reálné a živé emoce. Unikátní je také schopnost modelu vytvářet v rámci jednoho generovaného videa více záběrů, které přesně zachovávají podobu postav a vizuální styl.

Bezpečnostní opatření

Před uvolněním modelu Sora do produktů OpenAI jsou podle společnosti přijímána důležitá bezpečnostní opatření. Tvůrci spolupracují s odborníky na dezinformace, deepfakes a nenávistný obsah, které by bez vestavěných omezení bylo snadné s podobným nástrojem generovat. Kromě toho na straně OpenAI dochází k vývoji nástroje pro detekci závadného obsahu, včetně klasifikátoru schopného rozpoznat, zda bylo video generováno právě modelem Sora.

Až bude nástroj uvolněn pro veřejnost, bude textový klasifikátor kontrolovat a odmítat textové vstupy, které porušují pravidla používání, například požadavky na extrémní násilí, sexuální obsah, nenávistné obrázky, podobu celebrit nebo duševní vlastnictví jiných. Rozvinuté obrazové klasifikátory dokáží zkontrolovat každý snímek vygenerovaného videa, aby se zajistilo, že splňuje pravidla používání.

K čemu bude model použitelný?

Představení modelu Sora otevírá nové možnosti pro vizuální umělce, designéry a filmaře, poskytuje jim nástroj pro rozšíření jejich kreativity a inovace v jejich oborech. Zároveň však vyvstávají otázky týkající se možného zneužití technologie k šíření dezinformací nebo vytváření zavádějícího obsahu.

Využití technologie si umíme dobře představit např. v reklamním průmyslu, kde AI ohromně sníží náklady na produkci reklam a zajímavého obsahu. Pokud chcete vidět více fascinujících ukázek vygenerovaných videí, navštivte stránky https://openai.com/sora.

Spolupráce s politiky, lektory a umělci po celém světě je klíčová pro pochopení obav a identifikaci pozitivních využití této nové technologie. „Přestože byl model Sora podroben rozsáhlému výzkumu a testování, nelze předpovědět všechny způsoby, jakými bude technologie využívána nebo zneužívána,“ zmiňují tvůrci.

Kdy a za jakých podmínek se model Sora dostane do rukou veřejnosti zatím OpenAI neuvedla.

Zdroj: OpenAI, Sora

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Český zdicí robot naživo: Je překvapivě pomalý, na rozdíl od lidí ale nepotřebuje odpočívat
Český zdicí robot naživo: Je překvapivě pomalý, na rozdíl od lidí ale nepotřebuje odpočívat
Obrázek: Pohled do útrob Apple Vision Pro vs. Meta Quest 3: Co ukazují snímky z CT?
Pohled do útrob Apple Vision Pro vs. Meta Quest 3: Co ukazují snímky z CT?
Obrázek: Vylepšená služba Google Find My Device najde ztracená sluchátka, lokátory i vypnuté telefony
Vylepšená služba Google Find My Device najde ztracená sluchátka, lokátory i vypnuté telefony
Obrázek: Chytré meteostanice pomáhají s výukou v pražských školách
Chytré meteostanice pomáhají s výukou v pražských školách
Obrázek: Noční fotografie s vivo X100 Pro: Jak fotit v noci se smartphonem jako profík?
Noční fotografie s vivo X100 Pro: Jak fotit v noci se smartphonem jako profík?
Obrázek: Recenze robotického vysavače TESLA RoboStar iQ700 s laserovou navigací: Čistá domácnost bez námahy?
85%
Recenze robotického vysavače TESLA RoboStar iQ700 s laserovou navigací: Čistá domácnost bez námahy?
Obrázek: Zažijte budoucnost už dnes: Nainstalujte si umělou inteligenci Gemini do telefonu s Androidem
Zažijte budoucnost už dnes: Nainstalujte si umělou inteligenci Gemini do telefonu s Androidem
Obrázek: Kde koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Kde koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024