V uplynulém týdnu byl svět umělé inteligence svědkem několika vzrušujících novinek. Od pokroku v oblasti generování videa společností Google, přes klíčové aktualizace v autonomním řízení FSD od Tesly, až po dynamické změny ve vztazích mezi velkými hráči v AI průmyslu. Jaké novinky ze světa AI přinesly události posledních dní?
- 1. Google představil Lumiere: AI model pro generování videa
- 2. Tesla uvádí na trh FSD Beta v12, klíčový krok ke skutečně autonomnímu řízení
- 3. NVIDIA vylepšuje běžná videa na HDR pomocí AI a RTX GPU
- 4. Google ukončuje spolupráci se společností Appen, která pomáhala učit AI Bard
- 5. Přelom v čínském AI průmyslu – AntGroup spouští divizi NextEvo
Google představil Lumiere: AI model pro generování videa
Google představil Lumiere, nový model umělé inteligence pro generování videa z textu či obrázků, navržený pro vytváření realistických pohybů ve videu. Lumiere využívá architekturu Space-Time U-Net, která generuje celé video najednou, jediným průchodem modelem. Tím se liší od stávajících modelů pro generování videa, které syntetizují vzdálené klíčové snímky a mají tak často problém s konzistencí výstupu.
Google just made an incredible AI video breakthrough with its latest diffusion model, Lumiere.
2024 is going to be a massive year for AI video, mark my words.
Here's what separates Lumiere from other AI video models: pic.twitter.com/PulSjVZaCp
— Rowan Cheung (@rowancheung) January 25, 2024
Lumiere dosahuje velmi dobrých výsledků v generování videa z textu a dokáže plnit širokou škálu úkolů. Dokáže provádět úpravy videa, převod obrázků na video, retušovat videa a generovat videa v požadovaném stylu podle vzorového obrázku.
Oblast generování videa s pomocí AI může v tomto roce zažít obrovský boom, podobně jako loni AI generované obrázky. Lumiere, ačkoli na první pohled nemusí ve všech scénářích překonávat konkurenční platformy jako Runway Gen-2, se zdá v některých ohledech dokonce lepší.
Tesla uvádí na trh FSD Beta v12, klíčový krok ke skutečně autonomnímu řízení
Tesla vypustila aktualizaci FSD Beta v12 pro své zákazníky, což by mohl být rozhodující krok k naplnění jejích slibů o autonomním řízení. Tato aktualizace softwaru by měla přinést zásadní změny. Hlavní rozdíl oproti předchozím aktualizacím FSD spočívá v tom, že ovládání vozidla bude nyní zajišťováno neuronovými sítěmi místo tradičního programování programátory.
„FSD Beta v12 aktualizuje systém řízení na městských ulicích na jedinou end-to-end neuronová síť trénovanou na milionech videoklipů, nahrazující více než 300 tisíc řádků explicitního kódu C++,“ zmínila automobilka ve svém prohlášení. Krok by to měl být správný. Neuronové sítě mají oproti „natvrdo“ nakódovanému chování řadu výhod – mohou se učit a časem automaticky zlepšovat.
The first FSD Beta V12 drive in San Francisco 🔥🔥🔥 pic.twitter.com/PtfsQ8WRGK
— Teslaconomics (@Teslaconomics) January 22, 2024
Aktualizace byla dosud dostupná pouze pro interní testovací flotilu Tesly, ale nyní se konečně dostává ke koncovým zákazníkům. Několik testerů FSD Beta, kteří nejsou zaměstnanci Tesly, nyní hlásí, že obdrželi aktualizaci Tesla FSD Beta v12. Další mají podle Muska následovat v dalších týdnech. V nejbližších době tak můžeme očekávat řadu videí a postřehů z amerických silnic.
NVIDIA vylepšuje běžná videa na HDR pomocí AI a RTX GPU
NVIDIA zveřejnila užitečnou funkci pro majitele grafických karet z rodiny RTX. Nová funkce RTX Video HDR, která vylepšuje běžná videa na HDR kvalitu, používá umělou inteligenci k tomu, aby zvýšila kvalitu obrazu ve videích. Výsledkem jsou lepší a živější barvy. Pro použití této funkce potřebujete HDR-10 kompatibilní monitor a aktivované HDR ve Windows.
RTX Video HDR je součástí nejnovější aktualizace ovladačů 551.23 Game Ready a funguje v prohlížečích jako Microsoft Edge a Google Chrome. Uživatelé si mohou tuto funkci snadno zapnout v nastavení NVIDIA.
Funkce je určena pro novější NVIDIA RTX grafické karty, které jsou vybaveny speciálními jádry tensor pro zpracování AI úloh (RTX 20 a novější). NVIDIA také používá podobné AI technologie pro zlepšení výkonu a obrazu ve videohrách. Kromě toho, nejnovější aktualizace softwaru od NVIDIA přináší další vylepšení pro hry, včetně režimu s nízkým zpožděním pro lepší herní zážitek.
Google ukončuje spolupráci se společností Appen, která pomáhala učit AI Bard
Významnou změnu na poli umělé inteligence oznámila společnost Alphabet, která ukončila smluvní vztahy s australskou firmou Appen. Appen byla klíčovým partnerem v trénování AI modelů pro chatbota Bard, výsledky vyhledávání Google a další AI produkty.
Rozhodnutí Alphabetu, které vstoupí v platnost 19. března, představuje značný zásah do podnikání Appen, neboť smlouvy s Alphabetem tvořily přibližně třetinu jejích příjmů. Společnost Appen, se sídlem v Austrálii, je známá svou prací na AI modelech pro řadu technologických gigantů, včetně společností Microsoft, NVIDIA, Meta, Apple, Adobe, Google a Amazon.
Appen v posledních letech čelil odlivu zákazníků, odchodu vedoucích pracovníků a finančním problémům. V roce 2023 došlo k poklesu tržeb o 30 %, což následovalo po 13% poklesu v předchozím roce. Akcie společnosti od svého vrcholu v srpnu 2020 ztratily více než 99 % hodnoty.
Přelom v čínském AI průmyslu – AntGroup spouští divizi NextEvo
Čínská společnost AntGroup, patřící pod Alibaba, otevřela novou divizi zaměřenou na výzkum a vývoj umělé inteligence nazvanou NextEvo. Tento krok je významný pro ambice společnosti stát se lídrem v AI. NextEvo, vedené bývalým zaměstnancem Google Xu Pengem, se soustředí na vývoj pokročilého jazykového modelu Bailing a dalších AI technologií.
NextEvo se bude věnovat i vylepšení open source platformy pro hluboké učení (DLRover) a optimalizaci GPU (GLake), což jsou důležité prvky pro efektivní využití AI.
Iniciativa AntGroup je jedním z důkazů, že se Čína chce stát významnějším hráčem v oblasti umělé inteligence, a naznačuje velký potenciál pro budoucí vývoj v globálním AI průmyslu.