Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

MidJourney, DALL-E 2 a StabilityAI. Trojice aktuálně nejlepších projektů na bázi umělé inteligence (AI), která dokáže generovat obrázky a umělecká díla podle textového zadání. Jak si poradí se stejným zadáním? 

Umělá inteligence už je schopná generovat texty, fotorealistické obrázky nebo i věrohodná videa. Odborné kruhy a skupiny nadšenců v posledních měsících nadšeně sdílí obrázky vytvořené umělou inteligencí. Nejnovější srovnání dokazuje, že když dva (vlastně tři) dělají totéž, není to totéž.

V případě umělé inteligence hrají důležitou roli vstupní data, použitý algoritmus i samotné zadání. Každá AI se učila na jiných datech a má trochu rozdílný přístup ke generování obrázků.

Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Umělé inteligenci stačí slovy popsat, jaký obrázek má vytvořit. Pak už jen chvíli počkáte a obrázek je na světě. Foto: Se souhlasem MidJourney

Která umělá inteligence podává lepší výsledky?

Srovnání výstupů z projektů MidJourney, DALL-E 2 a StabilityAI bylo rozděleno na dvě oblasti. Konvergentní (když po AI něco chceme s velkým množstvím detailů a specifikací) a Divergentní (když jí dáme jen velmi málo pokynů a necháme výstup na její kreativitě).

Výstupy se následně dělí na další dvě části:

  • Konvergentní (Reálné). Když to, o co AI žádáme, je něco, co by mohlo patřit do reálného světa.
  • Konvergentní (Imaginární). Když to, co po AI žádáme, jako takové neexistuje, jde o nové výtvory.
  • Divergentní (Konkrétní). Když AI sice necháme určitý prostor, ale žádáme konkrétní výsledek.
  • Divergentní (Abstraktní). Když po AI žádáme, aby nám jako výstup dala vjemy a představy, nic konkrétního.
Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Výsledky se výrazně liší. Je však těžké určit, která AI je nejlepší. Hodně záleží na zadání. Foto: Se souhlasem David Alayón

Jak ukazují výsledky, z pohledu kreativity vede AI od MidJourney (první sloupec). Její výsledky nicméně nejsou příliš realistické. V tomto směru je lepší volbou DALL-E 2 a případně i StabilityAI. MidJourney selhává, protože není schopna vytvářet souvislé výtvory s velkým množstvím detailů. Na první pohled tak vypadají, ale při bližším pohledu je rozdíl patrný.

U lidí, pokud nám jde o výsledek podobný fotografii, jsou opět možnostmi DALL-E 2 a StabilityAI. Pokud chceme, aby to bylo provedeno ve specifickém uměleckém stylu, a neočekáváme, že budou detaily dokonalé, je opět volbou MidJourney.

Zdroj: David Alayón

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Obrázek: Test MOVA V50 Ultra: Robovysavač přeleze extrémně vysoké prahy, pohlídá domácnost a vytře horkou vodou
94%
Test MOVA V50 Ultra: Robovysavač přeleze extrémně vysoké prahy, pohlídá domácnost a vytře horkou vodou
iPhone 17 Pro s čipem A19 Pro nemá konkurenci. Mobilní čip předčí i výkonné procesory pro PC
Obrázek: Vychlazená sodovka tekoucí přímo z kohoutku? Chytré řešení od Teka vám přefiltruje vodu a odstraní mikroplasty
Vychlazená sodovka tekoucí přímo z kohoutku? Chytré řešení od Teka vám přefiltruje vodu a odstraní mikroplasty
Rozhovor: MOVA míří vysoko a chce porazit Xiaomi, vysavače a roboti byli jen začátek
Google varuje před obřím únikem dat. 2,5 miliardy uživatelů Gmailu v ohrožení
Jste opravdový Applista? Těchto pět tipů by měl znát každý majitel iPhonu
Obrázek: Zkrachoval vám dodavatel fotovoltaiky? Nepropadejte panice, takto situaci vyřešíte
Zkrachoval vám dodavatel fotovoltaiky? Nepropadejte panice, takto situaci vyřešíte
Soukromé konverzace s ChatGPT byly dohledatelné ve vyhledávačích. Jak být o krok napřed?