Tento týden se mezi širší skupinu uživatelů AI modelů konečně dostaly dlouho očekávané nástroje jako Sora či Canvas. Modernizace se pak dočkala i umělá inteligence Gemini, která slibuje novou generaci užitečných funkcí.
- 1. Sora AI konečně spuštěna, do Česka však zatím nedorazí
- 2. Programátoři jásají, model Canvas jim pomůže zefektivnit kódování
- 3. Chytré brýle Solo Air Vision budou vybaveny jednou z nejvýkonnějších AI na trhu
- 4. Microsoft bojuje proti negativním dopadům provozu umělé inteligence na klima
- 5. Gemini 2.0: Google se blýsknul novou řadou modelů
Sora AI konečně spuštěna, do Česka však zatím nedorazí
Společnost OpenAI v pondělí konečně uvedla na trh AI videogenerátor Sora. V únoru společnost předvedla model vybraným jednotlivcům, nyní přichází s novou nazvanou Sora Turbo. Sora dokáže generovat videa v rozlišení 1080p, která mohou být dlouhá až 20 sekund.
Model funguje na samostatné platformě přístupné na webu sora.com. Je však na místě říct, že v České republice zatím služba dostupná není. I kdybyste se ale k modelu chtěli přihlásit odjinud, musíte být aktivními předplatiteli programů ChatGPT Plus a Pro. Sora aktuálně dokáže generovat videa v širokoúhlém, vertikálním i čtvercovém poměru stran. Uživatelé mohou také nahrávat svá videa a obrázky a rozšiřovat, remixovat a míchat vlastní obsah do generovaných videí.
Programátoři jásají, model Canvas jim pomůže zefektivnit kódování
U novinek z dílny OpenAI ještě zůstaneme. Na trh se totiž z předběžného náhledu dostal ještě další zajímavý nástroj, a sice Canvas. Ten byl původně oznámen v říjnu jako vyskakovací okno ve stylu sandboxu, které uživatelům umožňuje provádět úpravy, formátování a další změny textu a kódu.
Funkce je postavena na modelu GPT-4o a k jejímu používání je tedy nutný i přístup k němu – neplatící uživatelé mají pouze omezené možnosti. Canvas je unikátním interaktivním prostředím, ve kterém mohou na projektech pracovat současné lidé i AI. Canvas je v podstatě interaktivní a kolaborativní okno pískoviště, kde mohou na určitých projektech pracovat současně lidé i AI. Vše funguje na bázi aktivní interakce s chatbotem, který uživatelům pomůže nejen s vývojem kódu, ale i s jeho opravami a testováním, a to bez nutnosti opuštění známého prostředí ChatGPT.
Chytré brýle Solo Air Vision budou vybaveny jednou z nejvýkonnějších AI na trhu
Tento týden byly představeny nové chytré brýle Solos AirGo Vision, které jsou kromě série předních kamer vybaveny i modelem GPT-4o. Ten dokáže odpovídat na dotazy o okolí uživatele. Funkčně se zařízení podobá chytrým brýlím Meta Ray-Ban, ačkoli nositelné brýle Solos nemohou nahrávat videa. Zařízení je také vybaveno virtuálními tlačítky a podporuje nabíjení přes USB-C.
Solos AirGo Vision nabízí hands-free s umělou inteligencí, kdy uživatel může jednoduše mluvit a ChatGPT bude odpovídat na dotazy. Chatbot dokáže odpovídat na obecné dotazy a také identifikovat a odpovídat na otázky týkající se objektů, osob, prostředí a textu zachyceného kamerou. Kromě toho mohou uživatelé požádat umělou inteligenci také o provedení složitých úkolů, jako je živý překlad textu do různých jazyků nebo dotaz na cestu k blízkým místům. Cena brýlí startuje v USA na 299 dolarech, tedy v přepočtu lehce přes 7 000 korun. Za příplatek si uživatelé mohou zakoupit čočky na předpis. Zařízení by se mělo začít prodávat ještě letos před Vánoci.
Microsoft bojuje proti negativním dopadům provozu umělé inteligence na klima
Společnost Microsoft se snaží zmírnit dopad svého rozmachu výstavby datových center na životní prostředí. Ty jsou v souvislosti s rozvojem AI stále více potřebné, ale zároveň i energeticky náročné. Technologický gigant tak přichází s inovací – k chlazení čipů a serverů nepoužívá vodu.
Nový provoz tak eliminuje spotřebu více než 125 milionů litrů vody, které každé datové centrum obvykle spotřebuje za jeden rok. Systém využívá recyklaci vody v podobě uzavřené smyčky, čímž odpadá potřeba doplňování čerstvých zásob. Microsoft vynaložil ve fiskálním roce končícím 30. června na kapitálové výdaje více než 50 miliard dolarů, z nichž naprostá většina padla právě na výstavbu datových center pohánějících modely umělé inteligence. V letošním roce plánuje tuto částku dokonce překonat, protože spotřeba energie na provoz sítí neustále roste.
Gemini 2.0: Google se blýsknul novou řadou modelů
Google tento týden ukázal nástupce rodiny modelů umělé inteligence Gemini 1.5, nazvaný Gemini 2.0. Nové AI nástroje přicházejí s vylepšenými schopnostmi, včetně nativní podpory generování obrázků a zvuku.
We're excited to introduce Gemini 2.0 – our most capable AI model yet – with 2.0 Flash Experimental.
Starting today, all Gemini users can now try out a chat-optimized version of Gemini 2.0 Flash Experimental, with enhanced performance on a number of key benchmarks and speed.… pic.twitter.com/HTIn1dDg7J
— Google Gemini App (@GeminiApp) December 11, 2024
V příspěvku na blogu společnost oznámila, že první vlaštovkou je model Gemini 2.0 Flash. Ten je o funkce umělé inteligence sice poměrně podstatně okleštěn, své nedostatky však kompenzuje nízkou latencí a vyšší efektivitou v porovnání s jinými nástroji. Gemini 2.0 Flash také podporuje multimodální výstup, jako je generování obrázků s textem a řízené vícejazyčné audio s převodem textu na řeč. Uživatelé Gemini si mohou vybrat z přístupu přes webové rozhraní či skrz mobilní aplikaci.