Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

OpenAI dnes překvapila uvedením modelu Sora schopného generovat videa. Zveřejněná videa vypadají překvapivě dobře a jsou na hranici rozeznatelnosti od reality či od děl profesionálních tvůrců. Vše, co pro vytvoření videa budete potřebovat, je zadat textové zadání a AI již vše vytvoří sama. Model Sora zvládá vytvářet videa dlouhá 60 sekund a scénu sám domyslí tak, aby působila realisticky.

Umělá inteligence schopná generovat text či obrázky je tu s námi už několik let, a za tu dobu udělala obrovský pokrok až do stavu, kdy jsou její výstupy k nerozeznání od reality. Co zatím pokulhávalo je generování videí, které mělo k dokonalosti daleko. OpenAI dnes představením modelu Sora zcela změnilo pravidla hry. Kvalita videí, která dokáže nová AI generovat, je překvapivě dobrá.

Vývoj umělé inteligence v posledních měsících a letech naznačuje, že hranice mezi digitálně generovaným obsahem a realitou postupně mizí, a brzy již nebude možné rozeznat rozdíly.

Jak např. vypadalo zadání pro AI, na jehož základě vzniklo video výše? Prompt zněl v překladu takto: „Krásné zasněžené a rušné Tokio. Kamera se pohybuje rušnou městskou ulicí a sleduje pár, který si užívá krásného zasněženého počasí a nakupuje v okolních stáncích. Spolu se sněhovými vločkami poletují ve větru nádherné okvětní lístky sakur.

Sora se inspirovala u ChatGPT i generátorů obrázků

Model Sora je postaven na difuzním modelu, který dokáže generovat celá videa najednou nebo rozšiřovat již vygenerovaná videa, aby byla delší. Použití architektury transformer, podobně jako u modelů GPT, modelu Sora umožňuje dosáhnout dobrých výsledků při škálování.

Obrázek: Rozeznáte video od reality? Tvůrci ChatGPT zveřejnili AI schopnou generovat fantastická videa

Scény již mohou být opravdu komplexní. Ještě před několika měsíci vypadala videa z AI generátorů typu Kaiber či BHuman spíše jako pochybné halucinace. Nyní už jsme jen malý krok od doby postfaktické. Foto: Se souhlasem OpenAI

Model je schopen generovat komplexní scény s více postavami, specifickými typy pohybu a přesnými detaily předmětů a pozadí. Díky hlubokému porozumění jazyku dokáže model Sora přesně interpretovat textové pokyny a generovat postavy, které vyjadřují reálné a živé emoce. Unikátní je také schopnost modelu vytvářet v rámci jednoho generovaného videa více záběrů, které přesně zachovávají podobu postav a vizuální styl.

Bezpečnostní opatření

Před uvolněním modelu Sora do produktů OpenAI jsou podle společnosti přijímána důležitá bezpečnostní opatření. Tvůrci spolupracují s odborníky na dezinformace, deepfakes a nenávistný obsah, které by bez vestavěných omezení bylo snadné s podobným nástrojem generovat. Kromě toho na straně OpenAI dochází k vývoji nástroje pro detekci závadného obsahu, včetně klasifikátoru schopného rozpoznat, zda bylo video generováno právě modelem Sora.

Až bude nástroj uvolněn pro veřejnost, bude textový klasifikátor kontrolovat a odmítat textové vstupy, které porušují pravidla používání, například požadavky na extrémní násilí, sexuální obsah, nenávistné obrázky, podobu celebrit nebo duševní vlastnictví jiných. Rozvinuté obrazové klasifikátory dokáží zkontrolovat každý snímek vygenerovaného videa, aby se zajistilo, že splňuje pravidla používání.

K čemu bude model použitelný?

Představení modelu Sora otevírá nové možnosti pro vizuální umělce, designéry a filmaře, poskytuje jim nástroj pro rozšíření jejich kreativity a inovace v jejich oborech. Zároveň však vyvstávají otázky týkající se možného zneužití technologie k šíření dezinformací nebo vytváření zavádějícího obsahu.

Využití technologie si umíme dobře představit např. v reklamním průmyslu, kde AI ohromně sníží náklady na produkci reklam a zajímavého obsahu. Pokud chcete vidět více fascinujících ukázek vygenerovaných videí, navštivte stránky https://openai.com/sora.

Spolupráce s politiky, lektory a umělci po celém světě je klíčová pro pochopení obav a identifikaci pozitivních využití této nové technologie. „Přestože byl model Sora podroben rozsáhlému výzkumu a testování, nelze předpovědět všechny způsoby, jakými bude technologie využívána nebo zneužívána,“ zmiňují tvůrci.

Kdy a za jakých podmínek se model Sora dostane do rukou veřejnosti zatím OpenAI neuvedla.

Zdroj: OpenAI, Sora

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Obrázek: Peklo: Ukrajina představila svůj nový raketový dron s děsivým názvem i schopnostmi
Peklo: Ukrajina představila svůj nový raketový dron s děsivým názvem i schopnostmi
Obrázek: Od 1. ledna 2025 už se eDoklady prokážete také u zdravotních pojišťoven, škol či bank
Od 1. ledna 2025 už se eDoklady prokážete také u zdravotních pojišťoven, škol či bank
Obrázek: Co kdybyste mohli ovládat zvuky kolem sebe? Vědci vyvinuli prototyp sluchátek, která to umožní
Co kdybyste mohli ovládat zvuky kolem sebe? Vědci vyvinuli prototyp sluchátek, která to umožní
Obrázek: Trump chce popustit AI uzdu, někteří jeho poradci ji však budou chtít krotit
Trump chce popustit AI uzdu, někteří jeho poradci ji však budou chtít krotit
Obrázek: Tyhle Black Friday nabídky si nenechte ujít: Nejvýhodnější neomezený tarif v ČR, Apple i směšně levná elektronika
Tyhle Black Friday nabídky si nenechte ujít: Nejvýhodnější neomezený tarif v ČR, Apple i směšně levná elektronika
Obrázek: Příběh jednoho podvodu: Koupil jsem falešná Apple sluchátka a nepoznali to ani v obchodu
Příběh jednoho podvodu: Koupil jsem falešná Apple sluchátka a nepoznali to ani v obchodu
Obrázek: Nejlepší telefon do 15 000 Kč: Ve slevových akcích pořídíte špičková zařízení
Nejlepší telefon do 15 000 Kč: Ve slevových akcích pořídíte špičková zařízení
Obrázek: Nejlepší telefony v Česku: Jaký vybrat, pokud chcete to nejlepší?
Nejlepší telefony v Česku: Jaký vybrat, pokud chcete to nejlepší?