Google rozšiřuje aplikaci Gemini o novou funkci. Nový model pro generování hudby s názvem Lyria 3 z dílny Google DeepMind umožňuje komukoliv vytvořit 30sekundovou skladbu, a to buď z textového popisu, nebo rovnou z nahrané fotky či videa. Funkce je nyní dostupná i uživatelům v České republice, zatím ale jen v angličtině a několika dalších světových jazycích. Čeština v nabídce chybí.
Princip je jednoduchý. Napište prompt, třeba „vytvoř melancholický indie pop o posledním dni léta“ a Gemini během vteřin vygeneruje kompletní skladbu včetně vlastního textu. Nebo nahrajte fotku ze svého výletu a nechte AI, ať sama rozhodne o náladě i žánru. Fantazii se meze nekladou. Model pak vytvoří originální cover obrázek pomocí modelu Nano Banana a výsledek je připravený ke sdílení nebo stažení.
Lyria 3 přináší oproti předchozím generacím zásadní posun, hudební kompozice jsou komplexnější, realističtější a hlavně máte jako uživatel mnohem větší kontrolu nad detaily. Chcete specifické tempo, konkrétní vokální styl nebo určitý žánr? Prostě to AI popište.
Skladba z fotky i textu, bez copyrightu
Gemini v praxi nabízí dva základní přístupy. První je klasický textový prompt. Čím konkrétnější, tím zajímavější výsledek na míru vaší potřebě. Funguje to třeba s osobními historkami, interními vtipy nebo vzpomínkami. Google jako příklad uvádí třeba prompt o psovi a toulkách lesem, nebo vtipný R&B ploužák o ponožce hledající svou druhou polovičku. Zní to směšně, ale výsledky jsou překvapivě dobré.
Foto: Redakce inSmart.cz
Druhý přístup bude pravděpodobně velmi populárnější pro tvorbu nejrůznějších stories. Nahrání fotografie nebo videa. Gemini analyzuje náladu snímku a na jejím základě složí text i hudbu. Tohle má potenciál zejména pro tvorbu obsahu na sociální sítě. Místo hledání vhodné licencované hudby prostě nahrajete fotku a máte originální soundtrack přesně na míru.
YouTube tvůrci dostanou Lyrii do Dream Tracku
Součástí oznámení je i integrace pro YouTube tvůrce. Lyria 3 bude dostupná v prostředí Dream Track, kde ji mohou využít k vytváření hudebních podkladů pro své Shorts. Přizpůsobení hudby, přidání sloky nebo jen vytvoření nálady do záběrů. To vše nově bez nutnosti řešit autorská práva k cizí hudbě. Tato část je zatím omezena na tvůrce v USA, postupné rozšiřování do dalších zemí je ale přislíbeno.
Citlivá otázka, která se u podobných nástrojů vždy objeví: co s autorskými právy? Google tvrdí, že Lyria 3 je navržena ke kreativní tvorbě, nikoli ke kopírování existujících umělců. Pokud prompt zmiňuje konkrétního interpreta, AI to vezme jako stylovou inspiraci, ne jako pokyn k napodobení. Nastavené filtry navíc výstupy průběžně porovnávají s existujícími díly.
Každá takto vytvořená skladba nese neviditelný digitální vodoznak SynthID. Kdokoliv tak může v aplikaci Gemini nahrát audio soubor a ověřit, zda byl vytvořen umělou inteligencí.
Dostupnost v Česku: ano, ale…
Lyria 3 je od spuštění dostupná globálně ve webové i mobilní aplikaci Gemini pro uživatele starší 18 let. Čeští uživatelé si ji tedy mohou hned vyzkoušet, jenže podpora jazyků je zatím omezena na angličtinu, němčinu, španělštinu, francouzštinu, hindštinu, japonštinu, korejštinu a portugalštinu. Čeština chybí. Výsledek přesto dostanete, ale text písně bude v jednom z podporovaných jazyků. Google zveřejnil i ukázky v češtině a lze tedy předpokládat, že se podpory češtiny dočkáme velmi brzy.
AI zpívá, píše, generuje krátké filmy a velmi dobře programuje. Jsme na prahu revoluce, kterou spousta lidí stále nevidí. Foto: Freepik
Vyšší limity pro tvorbu skladeb jsou vyhrazeny pro předplatitele tarifů Google AI Plus, Pro a Ultra. Bezplatní uživatelé mají přístup také, jen s nižším počtem generování. Zde Google konkrétní není.
Lyria není nástroj pro profesionální produkci. Je to rychlý, osobní a překvapivě zábavný způsob, jak vyjádřit náladu nebo vzpomínku způsobem, na který text ani fotka nestačí.
Zdroj: Google Blog




