AI generátor obrázků Midjourney přináší svým uživatelům novou – a rozhodně zajímavou – funkci. Prostřednictvím vylepšených nástrojů bude nyní možné uložit si parametry vygenerovaných osob do svých příkazů, odkud je budete moci prostřednictvím textu jednoduše vložit do nově vytvořených obrázků. Z referenčního obrázku je nyní velmi snadné vytvořit digitální klony, kde lze např. obličej používat v různých situacích a stylech.
Pryč jsou již doby, kdy se uživatelé obrázkových generátorů s umělou inteligencí rozplývali nad tím, když jim AI na základě jednoduchého popisku vytvořila ne příliš vydařený, avšak stále poměrně dost autentický obrázek odpovídající textovému zadání. V současnosti již probíhá masivní konkurenční boj o to, kdo učiní tvorbu obrázků za pomoci AI co nejjednodušší, nejintuitivnější a zároveň nejpropracovanější.
Midjourney boří hranice možností umělé inteligence
O toto prvenství se od svých prvopočátků uchází i AI Midjourney, která přichází s novými funkcemi umožňujícími generovat konzistentní grafické znaky na více separátních obrázcích. Primárně se přitom zaměřuje na zobrazení postav, jejíž fyziologické parametry mohou být nyní uloženy a kdykoliv znovu použity pro další tvorbu. Jde o významný posun v oblasti generativní umělé inteligence, jelikož řeší jeden z hlavních problémů dosavadních modelů. Generátory obrázků totiž nebyly schopné zapamatovat si předchozí styly vytvořeného obsahu, a uživatelé tak museli pracovat doslova od nuly. Možnost zachovat v obrázku fixní objekt sice některé AI modely nabízí (například Adobe Photoshop umožňuje označit výběr, který chcete ponechat, a zbytek obrazu nahradit tzv. generativní výplní), při snaze použít stejné osoby v různých pozicích či natočení z pohledu imaginární kamery však zatím umělé inteligenci scházela patřičná konzistence.
Midjourney + consistent characters is a game changer pic.twitter.com/3LgTRNZF1E
— Nick St. Pierre (@nickfloats) March 12, 2024
Vytvořte galerii obrázků stejných osob v různých prostředích
AI Midjourney se to snaží změnit svou novou funkcí, která zavádí značku -cref (zkratka z anglického character reference), kterou mohou uživatelé přidávat do svých textových příkazů. Pokud pak vložíte za tento tag URL z dříve vygenerovaného obrázku, pokusí se algoritmus porovnat obličejových rysů, typu postavy či stylu oblečení, a ten následně projektovat do nového díla. Při použití další značky, příkazu -cw doplněných číslem od 1 do 100, lze pak u nových obrázků nastavit míru odchylky od původního obsahu. Nižší hodnoty poskytují větší variabilitu, zatímco vyšší naopak poměrně věrně kopírují původní referenci.
Přestože se tato funkce stále teprve rozvíjí a zdokonaluje, představuje obrovský potenciál pro povýšení Midjourney z pouhého asistenta pro tvorbu nápadů na profesionální nástroj grafiků či fotografů. Díky konzistentnosti postavy bude například možné vytvářet celé příběhy složené z jednotlivých obrázků, a zachovat tak kontinuitu vyprávění, které chce autor generovaným dílem předat dál.