Vyzkoušet potenciál AI se nedávno rozhodl Stanislav Hruška, známý především pro svůj podcast STANDASHOW. S cílem vytvoření reklamní znělky jako propagačního materiálu pro své internetové pořady tak využil kombinaci několika AI modelů, které dokázaly vytvořit plnohodnotnou píseň.
Stanislav Hruška se již několik let úspěšně snaží prostřednictvím svých videí a podcastů oživovat českou internetovou scénu. Pole jeho působnosti je velmi obšírné, a zahrnuje také experimentování se současnými technologiemi, včetně umělé inteligence. Tu se tentokrát i se svým týmem rozhodl využít k vytvoření hudebního klipu, který měl být zároveň i reklamou na jednotlivé pořady, které Hruška se svými kolegy aktuálně moderuje na své platformě TALK. Projekt však zároveň velmi vkusně demonstruje schopnosti i limity současné AI v rámci umělecké tvorby.
O detaily ohledně vzniku zmíněného klipu se Hruška podělil prostřednictvím sociálních sítí. Jak sám komentuje, je až překvapující, že umělá inteligence již dnes dokáže vytvořit píseň, která je prakticky k nerozeznání od jiných hudebních děl aktuálně vysílaných například v českých rádiích. Přesto je třeba zmínit, že AI není v tomto ohledu tak úplně soběstačná, a v mnoha aspektech tak musel Hruškův tým vytváření písně do určité míry korigovat. Postupným zdokonalováním jazykových modelů generátorů audiovizuálního obsahu se však bude tato technologie stávat více a více soběstačnou.
Text písně nakonec vytvořil člověk. ChatGPT neumí dobře rýmovat
Prvním úkolem umělé inteligence bylo vytvořit samotný text písně. Za tímto účelem se Hruškův tým nejprve pokusil využít funkcí ChatGPT. Tento model se však podle autorových slov ukázal jako katastrofický. Kamenem úrazu pro chatbota se ukázalo být rýmování vygenerovaných textů. Proto byla slova k písničce nakonec vytvořena lidskou myslí.
Dalším krokem k úspěšnému složení písně bylo propojení textu a hudebního podkresu. K tomu ve výše uvedeném případě posloužila Suno AI, která je skutečně schopným audio generátorem. Uživatel si zvolí žánr písně, vloží předem vytvoření text a výsledné dílo je vytvořeno během několika sekund. Jak Hruška uvádí ve svém příspěvku, také Suna AI měla v tomto ohledu drobné nedostatky, především s výslovností některých slov. Jinak ale dokázala velmi rychle pracovat se zadanými příkazy, a vytvořit tak sérii stovek dvouminutových samplů, ze kterých byl později sestříhán konečný podkres.
V poslední fázi bylo nutné doplnit vokály. Ty pro jednotlivé zpěváky vytvořila umělá inteligence Jammable. Jelikož měl Hruška k dispozici skutečné autory použitých hlasů, mohl jednoduše posoudit, jak moc se AI odchýlila od reality. V tomto případě byla kvalita hlasových modelů poměrně nízká, a kompletní nahrazení živého zpěvu digitálním pro účely písně tak nebylo možné. Hlasové linky tak byly opět zmixovány člověkem, byť autoři konstatují, že umělá inteligence jim během pár sekund ušetřila několik dní práce. Její přínos je tedy navzdory přetrvávajícím limitům prakticky nezpochybnitelný.
Tuto písničku vytvořila kompletně umělá inteligence 😯 Kdyby vám ji pustili v rádiu, tak si ničeho nevšimnete. Je to masakr.
AI vymyslela melodii, rytmus i dynamiku. Vygenerovala zvuk všech nástrojů, a to včetně zpěvu a sboru. Jenom text a klip jsme si museli udělat sami.… pic.twitter.com/i7k354aaPz
— STANDASHOW (@StandaShow) April 2, 2024
Výše uvedený případ je pouze jedním případem z mnoha, a díla vygenerovaná umělou inteligencí již dnes zaplavují internet ve velkém. Stanislav Hruška v závěru svého postu shrnul, že projekt, který by běžně vyšel na statisíce, se rozpočtem nedostal před 10 000 korun. K písni byl vytvořen také klip, který si aktéři natočili sami, i takové úkoly však dnešní AI poměrně zdárně a kvalitně splní. Příkladem je nedávno představený model Sora od OpenAI, který vyvolal vlnu nadšení, ale také obav. Mají se tedy začít tvůrci hudebních děl a videoklipů strachovat o svou práci?
Budou lidé bez práce? Zatím ne
Sám Hruška tvrdí, že na situaci okolo AI a ztráty pracovních pozic se není třeba dívat negativisticky. Projekt totiž poskytl práci spoustě lidí, kteří by se jej bez umělé inteligence nikdy neúčastnili. Producent a podcaster zároveň zdůrazňuje, že neuronové sítě mohou ohrozit zaměstnání pouze těch lidí, kteří budou stát na opačné straně barikády, AI nezačnou používat, a budou se tak tomuto nevyhnutelnému pokroku bránit. Naopak je tedy třeba se této stále ještě nové příležitosti chopit a pokusit se z ní získat skutečné maximum.
Zdroje: Twitter STANDASHOW, Redakce inSmart.cz