Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

MidJourney, DALL-E 2 a StabilityAI. Trojice aktuálně nejlepších projektů na bázi umělé inteligence (AI), která dokáže generovat obrázky a umělecká díla podle textového zadání. Jak si poradí se stejným zadáním? 

Umělá inteligence už je schopná generovat texty, fotorealistické obrázky nebo i věrohodná videa. Odborné kruhy a skupiny nadšenců v posledních měsících nadšeně sdílí obrázky vytvořené umělou inteligencí. Nejnovější srovnání dokazuje, že když dva (vlastně tři) dělají totéž, není to totéž.

V případě umělé inteligence hrají důležitou roli vstupní data, použitý algoritmus i samotné zadání. Každá AI se učila na jiných datech a má trochu rozdílný přístup ke generování obrázků.

Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Umělé inteligenci stačí slovy popsat, jaký obrázek má vytvořit. Pak už jen chvíli počkáte a obrázek je na světě. Foto: Se souhlasem MidJourney

Která umělá inteligence podává lepší výsledky?

Srovnání výstupů z projektů MidJourney, DALL-E 2 a StabilityAI bylo rozděleno na dvě oblasti. Konvergentní (když po AI něco chceme s velkým množstvím detailů a specifikací) a Divergentní (když jí dáme jen velmi málo pokynů a necháme výstup na její kreativitě).

Výstupy se následně dělí na další dvě části:

  • Konvergentní (Reálné). Když to, o co AI žádáme, je něco, co by mohlo patřit do reálného světa.
  • Konvergentní (Imaginární). Když to, co po AI žádáme, jako takové neexistuje, jde o nové výtvory.
  • Divergentní (Konkrétní). Když AI sice necháme určitý prostor, ale žádáme konkrétní výsledek.
  • Divergentní (Abstraktní). Když po AI žádáme, aby nám jako výstup dala vjemy a představy, nic konkrétního.
Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Výsledky se výrazně liší. Je však těžké určit, která AI je nejlepší. Hodně záleží na zadání. Foto: Se souhlasem David Alayón

Jak ukazují výsledky, z pohledu kreativity vede AI od MidJourney (první sloupec). Její výsledky nicméně nejsou příliš realistické. V tomto směru je lepší volbou DALL-E 2 a případně i StabilityAI. MidJourney selhává, protože není schopna vytvářet souvislé výtvory s velkým množstvím detailů. Na první pohled tak vypadají, ale při bližším pohledu je rozdíl patrný.

U lidí, pokud nám jde o výsledek podobný fotografii, jsou opět možnostmi DALL-E 2 a StabilityAI. Pokud chceme, aby to bylo provedeno ve specifickém uměleckém stylu, a neočekáváme, že budou detaily dokonalé, je opět volbou MidJourney.

Zdroj: David Alayón

Obrázek: Jak vznikají chytré telefony? Návštěva továrny značky vivo aneb od součástek ke smartphonu ve vaší kapse
Jak vznikají chytré telefony? Návštěva továrny značky vivo aneb od součástek ke smartphonu ve vaší kapse
Obrázek: Rozhovor o chytrých televizorech: Na 8K ještě nenastal ten správný čas, věří Danny Tack z TP Vision
Rozhovor o chytrých televizorech: Na 8K ještě nenastal ten správný čas, věří Danny Tack z TP Vision
Obrázek: Tesla Cybertruck utáhne motor vesmírné rakety a naložená ve sprintu porazila i Porsche 911
Tesla Cybertruck utáhne motor vesmírné rakety a naložená ve sprintu porazila i Porsche 911
Obrázek: Saramonic BlinkMe B2: Mikrofon, se kterým vás uslyší i uvidí
Saramonic BlinkMe B2: Mikrofon, se kterým vás uslyší i uvidí
Obrázek: Píše vám Alza.cz? Podvodníci zneužívají Vánoc a luxují konta přes falešné stránky e-shopu
Píše vám Alza.cz? Podvodníci zneužívají Vánoc a luxují konta přes falešné stránky e-shopu
Obrázek: Co je to PPC reklama a kde všude se může zobrazit?
Co je to PPC reklama a kde všude se může zobrazit?
Obrázek: Nabíjení elektromobilu na cestách: Jak využít hotelové nabíječky?
Nabíjení elektromobilu na cestách: Jak využít hotelové nabíječky?
Obrázek: Gravírujeme laserem do dřeva i kovu: Praktický test gravírovačky TWO TREES TS2 10W
Gravírujeme laserem do dřeva i kovu: Praktický test gravírovačky TWO TREES TS2 10W