Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

MidJourney, DALL-E 2 a StabilityAI. Trojice aktuálně nejlepších projektů na bázi umělé inteligence (AI), která dokáže generovat obrázky a umělecká díla podle textového zadání. Jak si poradí se stejným zadáním? 

Umělá inteligence už je schopná generovat texty, fotorealistické obrázky nebo i věrohodná videa. Odborné kruhy a skupiny nadšenců v posledních měsících nadšeně sdílí obrázky vytvořené umělou inteligencí. Nejnovější srovnání dokazuje, že když dva (vlastně tři) dělají totéž, není to totéž.

V případě umělé inteligence hrají důležitou roli vstupní data, použitý algoritmus i samotné zadání. Každá AI se učila na jiných datech a má trochu rozdílný přístup ke generování obrázků.

Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Umělé inteligenci stačí slovy popsat, jaký obrázek má vytvořit. Pak už jen chvíli počkáte a obrázek je na světě. Foto: Se souhlasem MidJourney

Která umělá inteligence podává lepší výsledky?

Srovnání výstupů z projektů MidJourney, DALL-E 2 a StabilityAI bylo rozděleno na dvě oblasti. Konvergentní (když po AI něco chceme s velkým množstvím detailů a specifikací) a Divergentní (když jí dáme jen velmi málo pokynů a necháme výstup na její kreativitě).

Výstupy se následně dělí na další dvě části:

  • Konvergentní (Reálné). Když to, o co AI žádáme, je něco, co by mohlo patřit do reálného světa.
  • Konvergentní (Imaginární). Když to, co po AI žádáme, jako takové neexistuje, jde o nové výtvory.
  • Divergentní (Konkrétní). Když AI sice necháme určitý prostor, ale žádáme konkrétní výsledek.
  • Divergentní (Abstraktní). Když po AI žádáme, aby nám jako výstup dala vjemy a představy, nic konkrétního.
Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Výsledky se výrazně liší. Je však těžké určit, která AI je nejlepší. Hodně záleží na zadání. Foto: Se souhlasem David Alayón

Jak ukazují výsledky, z pohledu kreativity vede AI od MidJourney (první sloupec). Její výsledky nicméně nejsou příliš realistické. V tomto směru je lepší volbou DALL-E 2 a případně i StabilityAI. MidJourney selhává, protože není schopna vytvářet souvislé výtvory s velkým množstvím detailů. Na první pohled tak vypadají, ale při bližším pohledu je rozdíl patrný.

U lidí, pokud nám jde o výsledek podobný fotografii, jsou opět možnostmi DALL-E 2 a StabilityAI. Pokud chceme, aby to bylo provedeno ve specifickém uměleckém stylu, a neočekáváme, že budou detaily dokonalé, je opět volbou MidJourney.

Zdroj: David Alayón

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Vyznáte se v USB? Nová označení mají vše zjednodušit
Vyznáte se v USB? Nová označení mají vše zjednodušit
Obrázek: Amazon představil první čtečku Kindle se stylusem a budík mapující spánek
Amazon představil první čtečku Kindle se stylusem a budík mapující spánek
Obrázek: Hledáte výkonný notebook pro kreativní vyžití? Řada Studio je špičkou v oboru
Hledáte výkonný notebook pro kreativní vyžití? Řada Studio je špičkou v oboru
Obrázek: Jak na škody způsobené umělou inteligencí? EU upraví legislativu
Jak na škody způsobené umělou inteligencí? EU upraví legislativu
Obrázek: Co je to spyware a jak se proti němu bránit?
Co je to spyware a jak se proti němu bránit?
Obrázek: BeReal: Jak funguje sociální síť bez přetvářky?
BeReal: Jak funguje sociální síť bez přetvářky?
Obrázek: Přečtěte si příchozí zprávu, aniž by to kdokoliv věděl
Přečtěte si příchozí zprávu, aniž by to kdokoliv věděl
Obrázek: Jak zmizet z internetu beze stopy?
Jak zmizet z internetu beze stopy?