Letošní ročník vývojářské konference Google I/O ovládla umělá inteligence. Technologický gigant představil aktuální novinky i plány do budoucna – v obou případech hraje klíčovou roli Gemini AI, ze které se tak stává všestranný pomocný nástroj.
Asi nikoho nepřekvapí, že umělá inteligence byla hlavním tématem akce Google I/O 2024. Málokdo však dokázal předjímat, do jaké míry hodlá společnost tuto revoluční technologii využít. V čele těchto inovací pak stojí Gemini AI, multimodální jazykový model, který se za posledních několik měsíců vypracoval na špičku v oblasti nástrojů umělé inteligence. Google si tuto skutečnost moc dobře uvědomuje, a sází tak na svou AI i nadále. Generální ředitel Sundar Pichai dokonce uvedl, že se společnost aktuálně nachází v „éře Gemini“, což je s ohledem na představené projekty v rámci Google I/O více než příhodné označení. Jaké trumfy tedy firma na své konferenci vytáhla z rukávu?
Umělá inteligence od Googlu nabízí pomocnou ruku všude, kde se dá
Jednou z vítaných novinek, které budou k dispozici během letošního léta, je přidání Gemini do nástroje Fotky Google. Umělá inteligence vám tak umožní například filtrovat fotky na základě textových příkazů. Zlepšení se pak dočkala také experimentální platforma NotebookLM představená v minulém roce, která cílí na individualizovanou AI přizpůsobenou danému uživateli. Zajímavou vychytávkou odhalenou na Google I/O je i nástroj Agents, který představuje virtuálního osobního asistenta. Součástí prezentace byla i názorná ukázka situace, kdy chtěl uživatel reklamovat pár bot. V praxi pak stačilo boty vyfotit a zadat AI příkaz k jejich vrácení – asistent dokázal zboží sám identifikovat, dohledat k němu v Gmailu účtenku a následně sepsat e-mail s žádostí o reklamaci. Podobně jednoduše by také mělo být možné plánovat schůzky či dovolenou.
Projekt Astra aneb Když AI získá zrak
Dalším experimentálním projektem společnosti Google je Astra, který Gemini AI umožní připojit se ke kamerovému systému, což modelu umožní vnímat a interpretovat okolní svět. Nástroj tak dokáže na základě hlasových příkazů identifikovat konkrétní předměty v okolí a následně s nimi dále pracovat. Při záběru na zdrojový kód na obrazovce pak Astra dokáže rychle určit, k čemu slouží, případně posoudit jeho kvalitu. Nabízí se tak možnost vybavit touto technologií chytré brýle, které by uživatelům umožnily prakticky neustálé spojení s AI. Podobnou technologii nedávno představila například společnost Meta.
Pokroky v GenAI
Generativní umělá inteligence je jedním z nejpopulárnějších druhů AI. Google si je této informace vědom, a proto pro své uživatele vyvíjí hned několik takových nástrojů. Tím nejnovějším je Imagen 3, generátor obrázků, který dokáže vytvářet originální díla s vysokým rozlišením a detaily. Google a jeho vývojová laboratoř DeepMind dále pracuje i na videogenerátoru, který nese název Veo, a v jeho repertoáru nejdete například nástroje pro tvorbu HD videa či k editaci již vytvořených klipů. Sílu Veo se snaží testovat i herec a scénárista Donald Glover, který model testuje k produkci krátkého AI snímku.
Všechny výtvory generované umělou inteligencí pak Google chrání speciálním vodoznakem SynthID, který je tak neviditelným identifikátorem AI obsahu. GenAI by pak měla posílit také internetový vyhledávač či funkci Google Lens.
We loved what we saw with Veo at Google I/O so we turned it into a music video using our AI generated sound effects and music.
Take a listen. pic.twitter.com/rdNweGBaQ1
— ElevenLabs (@elevenlabsio) May 15, 2024
Gemini AI pomůže i při běžné kancelářské práci
Jazykový model Gemini byl již v minulosti integrován do prostředí Google Workspace. Postupně by ale měl své funkce v jednotlivých programech dále rozvíjet. Posílí tak například možnosti v aplikaci Gmail, kde nabídne souhrny dlouhých mailů. Za pomoci nástroje Chip pak chce Google svým klientům nabídnout asistenta pro projektové řízení. Ten bude schopen sledovat jednotlivá rozhodnutí v rámci pracovních týmů, a umožní tak zaměstnancům lépe plánovat další kroky.
Umělá inteligence i ve vašem telefonu
Google pochopitelně počítá i s integrací Gemini AI do svého operačního systému. Android by se tak měl stát prvním mobilním OS vybaveným takto pokročilým jazykovým modelem, což mu jistě poskytne výraznou konkurenční výhodu. I v tomto případě tak společnost počítá se zavedením osobního asistenta, který v sobě sjednotí hned několik funkcí umělé inteligence, které již známe z jiných AI nástrojů. Gemini v telefonu by měl údajně fungovat jako Asistent Google na steroidech. Bude schopen pochopit kontext obsahu na obrazovce, případně jej i slovně popisovat, či rozpozná spam hovor nebo podvodného volajícího na základě odposlechu hovorů. Tato funkce je však stále ve vývoji a zatím není jasné, kdy se objeví na trhu.
Here's a full recap of our news and updates from #GoogleIO — in under 10 minutes 🎉 pic.twitter.com/O2B8QPsNTg
— Google (@Google) May 15, 2024
Google na své konferenci opět ukázal, že právem patří ke světové špičce na poli moderních technologií a AI. Postupně bychom snad měli mít možnost si nové funkce Gemini vyzkoušet, a ověřit si tak, zda-li společnost dostojí svých slibů, a přinese nám nejpokročilejší jazykový model, který je aktuálně k dispozici.