Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

MidJourney, DALL-E 2 a StabilityAI. Trojice aktuálně nejlepších projektů na bázi umělé inteligence (AI), která dokáže generovat obrázky a umělecká díla podle textového zadání. Jak si poradí se stejným zadáním? 

Umělá inteligence už je schopná generovat texty, fotorealistické obrázky nebo i věrohodná videa. Odborné kruhy a skupiny nadšenců v posledních měsících nadšeně sdílí obrázky vytvořené umělou inteligencí. Nejnovější srovnání dokazuje, že když dva (vlastně tři) dělají totéž, není to totéž.

V případě umělé inteligence hrají důležitou roli vstupní data, použitý algoritmus i samotné zadání. Každá AI se učila na jiných datech a má trochu rozdílný přístup ke generování obrázků.

Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Umělé inteligenci stačí slovy popsat, jaký obrázek má vytvořit. Pak už jen chvíli počkáte a obrázek je na světě. Foto: Se souhlasem MidJourney

Která umělá inteligence podává lepší výsledky?

Srovnání výstupů z projektů MidJourney, DALL-E 2 a StabilityAI bylo rozděleno na dvě oblasti. Konvergentní (když po AI něco chceme s velkým množstvím detailů a specifikací) a Divergentní (když jí dáme jen velmi málo pokynů a necháme výstup na její kreativitě).

Výstupy se následně dělí na další dvě části:

  • Konvergentní (Reálné). Když to, o co AI žádáme, je něco, co by mohlo patřit do reálného světa.
  • Konvergentní (Imaginární). Když to, co po AI žádáme, jako takové neexistuje, jde o nové výtvory.
  • Divergentní (Konkrétní). Když AI sice necháme určitý prostor, ale žádáme konkrétní výsledek.
  • Divergentní (Abstraktní). Když po AI žádáme, aby nám jako výstup dala vjemy a představy, nic konkrétního.
Obrázek: Žádný z těchto obrázků nevytvořil člověk: Souboj 3 umělých inteligencí na vlastní oči

Výsledky se výrazně liší. Je však těžké určit, která AI je nejlepší. Hodně záleží na zadání. Foto: Se souhlasem David Alayón

Jak ukazují výsledky, z pohledu kreativity vede AI od MidJourney (první sloupec). Její výsledky nicméně nejsou příliš realistické. V tomto směru je lepší volbou DALL-E 2 a případně i StabilityAI. MidJourney selhává, protože není schopna vytvářet souvislé výtvory s velkým množstvím detailů. Na první pohled tak vypadají, ale při bližším pohledu je rozdíl patrný.

U lidí, pokud nám jde o výsledek podobný fotografii, jsou opět možnostmi DALL-E 2 a StabilityAI. Pokud chceme, aby to bylo provedeno ve specifickém uměleckém stylu, a neočekáváme, že budou detaily dokonalé, je opět volbou MidJourney.

Zdroj: David Alayón

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Propouštění u technologických gigantů pokračuje: PayPal propustí až 2 000 lidí
Propouštění u technologických gigantů pokračuje: PayPal propustí až 2 000 lidí
Obrázek: Krizi překonáme díky umělé inteligenci a zelené energii, tvrdí český podnikatel
Krizi překonáme díky umělé inteligenci a zelené energii, tvrdí český podnikatel
Obrázek: Recyklovatelný dům z 3D tiskárny? Chystá se revoluce v bydlení
Recyklovatelný dům z 3D tiskárny? Chystá se revoluce v bydlení
Obrázek: Android AirTag: Google chce vlastní sledovací přívěsek, má být přesnější než Apple
Android AirTag: Google chce vlastní sledovací přívěsek, má být přesnější než Apple
Obrázek: Recenze: Česká čistička vzduchu GARNI 45T OneCare obstála na výbornou
93%
Recenze: Česká čistička vzduchu GARNI 45T OneCare obstála na výbornou
Znečištěný vzduch
Čistíte si doma vzduch? Co znamená PM 2.5 a jaký mohou mít nečistoty vliv na vaše zdraví?
Obrázek: Blíží se kometa, kterou můžete vidět pouze jednou za 50 000 let. Jak ji sledovat?
Blíží se kometa, kterou můžete vidět pouze jednou za 50 000 let. Jak ji sledovat?
Obrázek: Konec složitostem. Novinka ve WhatsAppu ušetří hodiny se zálohováním
Konec složitostem. Novinka ve WhatsAppu ušetří hodiny se zálohováním