Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

MidJourney, DALL-E 2 a StabilityAI. Trojice aktuálně nejlepších projektů na bázi umělé inteligence (AI), která dokáže generovat obrázky a umělecká díla podle textového zadání. Jak si poradí se stejným zadáním? 

Umělá inteligence už je schopná generovat texty, fotorealistické obrázky nebo i věrohodná videa. Odborné kruhy a skupiny nadšenců v posledních měsících nadšeně sdílí obrázky vytvořené umělou inteligencí. Nejnovější srovnání dokazuje, že když dva (vlastně tři) dělají totéž, není to totéž.

V případě umělé inteligence hrají důležitou roli vstupní data, použitý algoritmus i samotné zadání. Každá AI se učila na jiných datech a má trochu rozdílný přístup ke generování obrázků.

Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Umělé inteligenci stačí slovy popsat, jaký obrázek má vytvořit. Pak už jen chvíli počkáte a obrázek je na světě. Foto: Se souhlasem MidJourney

Která umělá inteligence podává lepší výsledky?

Srovnání výstupů z projektů MidJourney, DALL-E 2 a StabilityAI bylo rozděleno na dvě oblasti. Konvergentní (když po AI něco chceme s velkým množstvím detailů a specifikací) a Divergentní (když jí dáme jen velmi málo pokynů a necháme výstup na její kreativitě).

Výstupy se následně dělí na další dvě části:

  • Konvergentní (Reálné). Když to, o co AI žádáme, je něco, co by mohlo patřit do reálného světa.
  • Konvergentní (Imaginární). Když to, co po AI žádáme, jako takové neexistuje, jde o nové výtvory.
  • Divergentní (Konkrétní). Když AI sice necháme určitý prostor, ale žádáme konkrétní výsledek.
  • Divergentní (Abstraktní). Když po AI žádáme, aby nám jako výstup dala vjemy a představy, nic konkrétního.
Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Výsledky se výrazně liší. Je však těžké určit, která AI je nejlepší. Hodně záleží na zadání. Foto: Se souhlasem David Alayón

Jak ukazují výsledky, z pohledu kreativity vede AI od MidJourney (první sloupec). Její výsledky nicméně nejsou příliš realistické. V tomto směru je lepší volbou DALL-E 2 a případně i StabilityAI. MidJourney selhává, protože není schopna vytvářet souvislé výtvory s velkým množstvím detailů. Na první pohled tak vypadají, ale při bližším pohledu je rozdíl patrný.

U lidí, pokud nám jde o výsledek podobný fotografii, jsou opět možnostmi DALL-E 2 a StabilityAI. Pokud chceme, aby to bylo provedeno ve specifickém uměleckém stylu, a neočekáváme, že budou detaily dokonalé, je opět volbou MidJourney.

Zdroj: David Alayón

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Cesta z osamělosti, nebo pád do ještě větší? AI je emocionální pomocník i hrozba
Obrázek: Viděli jsme budoucnost robotických sekaček. Navimow dorazí na český trh již v únoru
Viděli jsme budoucnost robotických sekaček. Navimow dorazí na český trh již v únoru
Zařízení společnosti Aircela stojí na ověřené vědě, není však efektivní. Alespoň zatím ne.
Pohonné hmoty bez fosilních paliv? Chytré zařízení přeměňuje oxid uhličitý na benzín
Čínští vědci vyřešili slabinu nositelné elektroniky. Nový AI superčip může změnit celý trh
Změňte si svůj trapný e-mail ze střední školy, Gmail to konečně umožní
Vybere si každý, i s nízkým rozpočtem. Vybrali jsme nejzajímavější herní notebooky
Češi, pozor na falešné e-shopy, bazary a podvodné SMS. Jak na bezpečné vánoční nákupy?
Recenze AI překladače Timekettle W4: Zkusili jsme mluvit česky v Číně a fungovalo to