Google Gemini nyní složí píseň z vaší fotky. Stačí jeden prompt

Google rozšiřuje aplikaci Gemini o novou funkci. Nový model pro generování hudby s názvem Lyria 3 z dílny Google DeepMind umožňuje komukoliv vytvořit 30sekundovou skladbu, a to buď z textového popisu, nebo rovnou z nahrané fotky či videa. Funkce je nyní dostupná i uživatelům v České republice, zatím ale jen v angličtině a několika dalších světových jazycích. Čeština v nabídce chybí.

Princip je jednoduchý. Napište prompt, třeba „vytvoř melancholický indie pop o posledním dni léta“ a Gemini během vteřin vygeneruje kompletní skladbu včetně vlastního textu. Nebo nahrajte fotku ze svého výletu a nechte AI, ať sama rozhodne o náladě i žánru. Fantazii se meze nekladou. Model pak vytvoří originální cover obrázek pomocí modelu Nano Banana a výsledek je připravený ke sdílení nebo stažení.

Lyria 3 přináší oproti předchozím generacím zásadní posun, hudební kompozice jsou komplexnější, realističtější a hlavně máte jako uživatel mnohem větší kontrolu nad detaily. Chcete specifické tempo, konkrétní vokální styl nebo určitý žánr? Prostě to AI popište.

Skladba z fotky i textu, bez copyrightu

Gemini v praxi nabízí dva základní přístupy. První je klasický textový prompt. Čím konkrétnější, tím zajímavější výsledek na míru vaší potřebě. Funguje to třeba s osobními historkami, interními vtipy nebo vzpomínkami. Google jako příklad uvádí třeba prompt o psovi a toulkách lesem, nebo vtipný R&B ploužák o ponožce hledající svou druhou polovičku. Zní to směšně, ale výsledky jsou překvapivě dobré.

Obrázek: Google Gemini nyní složí píseň z vaší fotky. Stačí jeden prompt

Foto: Redakce inSmart.cz

Druhý přístup bude pravděpodobně velmi populárnější pro tvorbu nejrůznějších stories. Nahrání fotografie nebo videa. Gemini analyzuje náladu snímku a na jejím základě složí text i hudbu. Tohle má potenciál zejména pro tvorbu obsahu na sociální sítě. Místo hledání vhodné licencované hudby prostě nahrajete fotku a máte originální soundtrack přesně na míru.

YouTube tvůrci dostanou Lyrii do Dream Tracku

Součástí oznámení je i integrace pro YouTube tvůrce. Lyria 3 bude dostupná v prostředí Dream Track, kde ji mohou využít k vytváření hudebních podkladů pro své Shorts. Přizpůsobení hudby, přidání sloky nebo jen vytvoření nálady do záběrů. To vše nově bez nutnosti řešit autorská práva k cizí hudbě. Tato část je zatím omezena na tvůrce v USA, postupné rozšiřování do dalších zemí je ale přislíbeno.

Citlivá otázka, která se u podobných nástrojů vždy objeví: co s autorskými právy? Google tvrdí, že Lyria 3 je navržena ke kreativní tvorbě, nikoli ke kopírování existujících umělců. Pokud prompt zmiňuje konkrétního interpreta, AI to vezme jako stylovou inspiraci, ne jako pokyn k napodobení. Nastavené filtry navíc výstupy průběžně porovnávají s existujícími díly.

Každá takto vytvořená skladba nese neviditelný digitální vodoznak SynthID. Kdokoliv tak může v aplikaci Gemini nahrát audio soubor a ověřit, zda byl vytvořen umělou inteligencí.

Dostupnost v Česku: ano, ale…

Lyria 3 je od spuštění dostupná globálně ve webové i mobilní aplikaci Gemini pro uživatele starší 18 let. Čeští uživatelé si ji tedy mohou hned vyzkoušet, jenže podpora jazyků je zatím omezena na angličtinu, němčinu, španělštinu, francouzštinu, hindštinu, japonštinu, korejštinu a portugalštinu. Čeština chybí. Výsledek přesto dostanete, ale text písně bude v jednom z podporovaných jazyků. Google zveřejnil i ukázky v češtině a lze tedy předpokládat, že se podpory češtiny dočkáme velmi brzy.

Obrázek: Google Gemini nyní složí píseň z vaší fotky. Stačí jeden prompt

AI zpívá, píše, generuje krátké filmy a velmi dobře programuje. Jsme na prahu revoluce, kterou spousta lidí stále nevidí. Foto: Freepik

Vyšší limity pro tvorbu skladeb jsou vyhrazeny pro předplatitele tarifů Google AI Plus, Pro a Ultra. Bezplatní uživatelé mají přístup také, jen s nižším počtem generování. Zde Google konkrétní není.

Lyria není nástroj pro profesionální produkci. Je to rychlý, osobní a překvapivě zábavný způsob, jak vyjádřit náladu nebo vzpomínku způsobem, na který text ani fotka nestačí.

Zdroj: Google Blog

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Obrázek: Zalando v éře umělé inteligence: AI pomáhá s tvorbou obsahu i ve virtuálním šatníku (reportáž)
Zalando v éře umělé inteligence: AI pomáhá s tvorbou obsahu i ve virtuálním šatníku (reportáž)
Datová centra a obří katapult. Musk chce dostat umělou inteligenci na Měsíc
Obrázek: Rusové jsou bez Starlinku bezradní. Vlastní náhradu nemají a nutí Ukrajince registrovat terminály
Rusové jsou bez Starlinku bezradní. Vlastní náhradu nemají a nutí Ukrajince registrovat terminály
Obrázek: Otravný zvuk a fantastické záběry. Jak vypadají drony, které létají za sportovci na olympiádě?
Otravný zvuk a fantastické záběry. Jak vypadají drony, které létají za sportovci na olympiádě?
Změňte si svůj trapný e-mail ze střední školy, Gmail to konečně umožní
Vybere si každý, i s nízkým rozpočtem. Vybrali jsme nejzajímavější herní notebooky
Češi, pozor na falešné e-shopy, bazary a podvodné SMS. Jak na bezpečné vánoční nákupy?
Recenze AI překladače Timekettle W4: Zkusili jsme mluvit česky v Číně a fungovalo to