Novinky ze světa AI #39: Google generuje videa z textu, Tesla vydává AI autopilota

V uplynulém týdnu byl svět umělé inteligence svědkem několika vzrušujících novinek. Od pokroku v oblasti generování videa společností Google, přes klíčové aktualizace v autonomním řízení FSD od Tesly, až po dynamické změny ve vztazích mezi velkými hráči v AI průmyslu. Jaké novinky ze světa AI přinesly události posledních dní?

Google představil Lumiere: AI model pro generování videa

Google představil Lumiere, nový model umělé inteligence pro generování videa z textu či obrázků, navržený pro vytváření realistických pohybů ve videu. Lumiere využívá architekturu Space-Time U-Net, která generuje celé video najednou, jediným průchodem modelem. Tím se liší od stávajících modelů pro generování videa, které syntetizují vzdálené klíčové snímky a mají tak často problém s konzistencí výstupu.

Lumiere dosahuje velmi dobrých výsledků v generování videa z textu a dokáže plnit širokou škálu úkolů. Dokáže provádět úpravy videa, převod obrázků na video, retušovat videa a generovat videa v požadovaném stylu podle vzorového obrázku.

Oblast generování videa s pomocí AI může v tomto roce zažít obrovský boom, podobně jako loni AI generované obrázky. Lumiere, ačkoli na první pohled nemusí ve všech scénářích překonávat konkurenční platformy jako Runway Gen-2, se zdá v některých ohledech dokonce lepší.

Tesla uvádí na trh FSD Beta v12, klíčový krok ke skutečně autonomnímu řízení

Tesla vypustila aktualizaci FSD Beta v12 pro své zákazníky, což by mohl být rozhodující krok k naplnění jejích slibů o autonomním řízení. Tato aktualizace softwaru by měla přinést zásadní změny. Hlavní rozdíl oproti předchozím aktualizacím FSD spočívá v tom, že ovládání vozidla bude nyní zajišťováno neuronovými sítěmi místo tradičního programování programátory.

„FSD Beta v12 aktualizuje systém řízení na městských ulicích na jedinou end-to-end neuronová síť trénovanou na milionech videoklipů, nahrazující více než 300 tisíc řádků explicitního kódu C++,“ zmínila automobilka ve svém prohlášení. Krok by to měl být správný. Neuronové sítě mají oproti „natvrdo“ nakódovanému chování řadu výhod – mohou se učit a časem automaticky zlepšovat.

Aktualizace byla dosud dostupná pouze pro interní testovací flotilu Tesly, ale nyní se konečně dostává ke koncovým zákazníkům. Několik testerů FSD Beta, kteří nejsou zaměstnanci Tesly, nyní hlásí, že obdrželi aktualizaci Tesla FSD Beta v12. Další mají podle Muska následovat v dalších týdnech. V nejbližších době tak můžeme očekávat řadu videí a postřehů z amerických silnic.

NVIDIA vylepšuje běžná videa na HDR pomocí AI a RTX GPU

NVIDIA zveřejnila užitečnou funkci pro majitele grafických karet z rodiny RTX. Nová funkce RTX Video HDR, která vylepšuje běžná videa na HDR kvalitu, používá umělou inteligenci k tomu, aby zvýšila kvalitu obrazu ve videích. Výsledkem jsou lepší a živější barvy. Pro použití této funkce potřebujete HDR-10 kompatibilní monitor a aktivované HDR ve Windows.

RTX Video HDR je součástí nejnovější aktualizace ovladačů 551.23 Game Ready a funguje v prohlížečích jako Microsoft Edge a Google Chrome. Uživatelé si mohou tuto funkci snadno zapnout v nastavení NVIDIA.

Funkce je určena pro novější NVIDIA RTX grafické karty, které jsou vybaveny speciálními jádry tensor pro zpracování AI úloh (RTX 20 a novější). NVIDIA také používá podobné AI technologie pro zlepšení výkonu a obrazu ve videohrách. Kromě toho, nejnovější aktualizace softwaru od NVIDIA přináší další vylepšení pro hry, včetně režimu s nízkým zpožděním pro lepší herní zážitek.

Google ukončuje spolupráci se společností Appen, která pomáhala učit AI Bard

Významnou změnu na poli umělé inteligence oznámila společnost Alphabet, která ukončila smluvní vztahy s australskou firmou Appen. Appen byla klíčovým partnerem v trénování AI modelů pro chatbota Bard, výsledky vyhledávání Google a další AI produkty.

Rozhodnutí Alphabetu, které vstoupí v platnost 19. března, představuje značný zásah do podnikání Appen, neboť smlouvy s Alphabetem tvořily přibližně třetinu jejích příjmů. Společnost Appen, se sídlem v Austrálii, je známá svou prací na AI modelech pro řadu technologických gigantů, včetně společností Microsoft, NVIDIA, Meta, Apple, Adobe, Google a Amazon.

Obrázek: Novinky ze světa AI #39: Google generuje videa z textu, Tesla vydává AI autopilota

Bard zatím kvalit ChatGPT nedosahuje. Postupně se však zlepšuje. Zdroj: Unsplash

Appen v posledních letech čelil odlivu zákazníků, odchodu vedoucích pracovníků a finančním problémům. V roce 2023 došlo k poklesu tržeb o 30 %, což následovalo po 13% poklesu v předchozím roce. Akcie společnosti od svého vrcholu v srpnu 2020 ztratily více než 99 % hodnoty.

Přelom v čínském AI průmyslu – AntGroup spouští divizi NextEvo

Čínská společnost AntGroup, patřící pod Alibaba, otevřela novou divizi zaměřenou na výzkum a vývoj umělé inteligence nazvanou NextEvo. Tento krok je významný pro ambice společnosti stát se lídrem v AI. NextEvo, vedené bývalým zaměstnancem Google Xu Pengem, se soustředí na vývoj pokročilého jazykového modelu Bailing a dalších AI technologií.

Obrázek: Novinky ze světa AI #39: Google generuje videa z textu, Tesla vydává AI autopilota

Čína si uvědomuje důležitost AI. Zatímco AI se snaží regulovat, ostatní investují do rychlého vývoje. Zdroj: Pixabay

NextEvo se bude věnovat i vylepšení open source platformy pro hluboké učení (DLRover) a optimalizaci GPU (GLake), což jsou důležité prvky pro efektivní využití AI.

Iniciativa AntGroup je jedním z důkazů, že se Čína chce stát významnějším hráčem v oblasti umělé inteligence, a naznačuje velký potenciál pro budoucí vývoj v globálním AI průmyslu.

Zdroje: 1, 2, 3, 4

Odebírat
Upozornit na
guest
0 Komentářů
Inline Feedbacks
View all comments
Obrázek: Jako robíci z Červeného trpaslíka: Chytrá AI lampička od Xiaomi sleduje vaše ruce a chová se jako mazlíček
Jako robíci z Červeného trpaslíka: Chytrá AI lampička od Xiaomi sleduje vaše ruce a chová se jako mazlíček
Obrázek: Doogee má s Českem velké plány. Na MWC 2024 představilo skládací FLIP X a chytrý prsten
Doogee má s Českem velké plány. Na MWC 2024 představilo skládací FLIP X a chytrý prsten
Obrázek: GPU vs. CPU: O kolik akcelerace AI na GPU urychlí práci ve Photoshopu? Změřili jsme rozdíl s NVIDIA RTX 4070
GPU vs. CPU: O kolik akcelerace AI na GPU urychlí práci ve Photoshopu? Změřili jsme rozdíl s NVIDIA RTX 4070
Obrázek: 18 karátů, EKG a cena ojetého auta. Huawei na MWC 2024 ukázal své nejlepší hodinky a notebooky
18 karátů, EKG a cena ojetého auta. Huawei na MWC 2024 ukázal své nejlepší hodinky a notebooky
Obrázek: Jak koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Jak koupit Bitcoin v ČR? Návod na bezpečný nákup kryptoměn v roce 2024
Obrázek: Jak rychle nabijete chytrý telefon? Nabíjení Redmi Note 13 Pro+ je rychlejší než vaše ranní káva
Jak rychle nabijete chytrý telefon? Nabíjení Redmi Note 13 Pro+ je rychlejší než vaše ranní káva
Obrázek: Občanka v mobilu od A do Z: Jak nainstalovat a zprovoznit eDoklady?
Občanka v mobilu od A do Z: Jak nainstalovat a zprovoznit eDoklady?
Obrázek: 5 způsobů, jak zjistit zapomenuté heslo K WiFi. Snadno v PC i na mobilu
5 způsobů, jak zjistit zapomenuté heslo K WiFi. Snadno v PC i na mobilu