GPT-4 je tady! Víme, co umí multimodální umělá inteligence

Jazykový model GPT-4 byl představen veřejnosti. Oproti stávajícím modelům bude multimodální a dokáže tak vedle textu pracovat také s obrázky a videem.

Německá prezentace společnosti Microsoft na téma velkých jazykových modelů (Large Language Models – LLM) odhalila datum představení nové verze jazykového modelu GPT od OpenAI. GPT je tzv. multimodální, tedy schopna pracovat vedle textů také s obrázky a videem. Schopna je je také rovnou generovat.

Obrázek: GPT-4 je tady: Zažíváme iPhone moment, umělá inteligence změní svět

Umělá inteligence bude nesmírně efektivní asistentkou se vším všudy. Řadu pracovníků úplně nahradí. Foto: Freepik

V článku najdete: skrýt

1. Multimodální umělá inteligence
2. Jak se změní firmy kvůli AI?
3. Konkrétní příklady: Kde má dnes smysl umělou inteligenci nasadit?
4. Je AI spolehlivá?

Multimodální umělá inteligence

„Příští týden představíme GPT-4, kde budeme mít multimodální modely, které nabídnou zcela jiné možnosti – například videa,“ řekl Andreas Braun, CTO německé pobočky společnosti Microsoft. Technický ředitel označil LLM za game changer, protože učí stroje rozumět přirozenému jazyku, a ty pak statistickým způsobem chápou to, co bylo dříve čitelné a srozumitelné pouze pro člověka. Technologie mezitím dospěla tak daleko, že jazykový model v podstatě funguje ve všech jazycích. Můžete položit otázku v němčině a dostat odpověď v italštině. Díky multimodalitě se stal model OpenAI komplexnější.

A zvěsti se potvrdily – GPT-4 dokáže pochopit obsah videa či zvukové stopy. To samé zvládne s obrázkem. Nejde tedy nutně o generování videí a obrázků, ale právě o pochopení jejich obsahu.

Saving this for later, in case my grandma asks me about what multimodal means pic.twitter.com/0rQFqBPwe7

— Charly Wargnier (@DataChaz) March 16, 2023

Jak se změní firmy kvůli AI?

Generální ředitelka německé pobočky Microsoftu, Marianne Janik, hovořila o vlivu umělé inteligence na firmy. Podle CEO je současný vývoj AI a ChatGPT srovnatelný s příchodem iPhonu na trh. Podle ní není cílem nahrazení lidí a redukce pracovních míst, ale provádění opakujících se úkolů jiným způsobem než dosud.

Za tzv. iPhone moment bývá označována situace, kdy je technologie natolik zlomová, jako iPhone ve své době. iPhone otřásl trhem s mobily a pomohl pádu Nokie či BlackBerry. V mnoha věcech bych revoluční, byť pouze lépe využil již dostupné technologie. A podobně to nyní podle odborníků bude s AI.

A když už k rušení pracovních míst dojde, je to podle ní potřeba brát jako příležitost. „Bude zapotřebí mnoha odborníků, aby využití umělé inteligence přineslo přidanou hodnotu“, zdůraznila Janik. Vlivem AI vznikají nové zajímavé profese. Firmám mj. doporučuje, aby interní kompetenční centra, kde budou školit zaměstnance ve využívání AI a sdružovat nápady na projekty.

Janik mj. zmínila, že Microsoft data uživatelů nepoužívá k učení své umělé inteligence, kterou si lze nyní vyzkoušet např. ve vyhledávači Bing. To samé ovšem neplatí pro OpenAI, do které Microsoft hojně investuje. Těšit se podle ní v dohledné době můžeme na integraci umělé inteligence do Outlooku, Teams či platformy Azure.

Konkrétní příklady: Kde má dnes smysl umělou inteligenci nasadit?

Umělá inteligence a jazykové modely jsou již dnes schopny pomoci ušetřit spoustu práce. Překvapivě efektivní se služby typu Codex a Copilot ukazují v oblasti programování. Clemens Siebler (Senior AI Specialist společnosti Microsoft) ilustroval na konkrétních příkladech, jaké možnosti už dnes AI nabízí.

Co by lidem zabralo stovky hodin zvládne AI za chvíli. Foto: Freepik

Podle Sieblera by společnosti například mohly nahrávat telefonní hovory, ty by AI přepsala na text a následně připravila shrnutí toho nejdůležitějšího. Podle Sieblera by to u velkého zákazníka společnosti Microsoft v Nizozemsku, který denně přijme 30 000 hovorů, mohlo ušetřit 500 hodin pracovníků každý den. Prototyp projektu byl vytvořen během dvou hodin, jediný vývojář projekt dokázal zaimplementovat za čtrnáct dní (plus další čas na finální implementaci do ostrého provozu).

Podle Sieblera jsou třemi nejčastějšími případy použití zodpovídání dotazů na firemní znalosti, které jsou přístupné pouze zaměstnancům, zpracování dokumentů s pomocí AI a poloautomatizace zpracováním mluvené řeči v call a response centru.

Je AI spolehlivá?

Na otázku ohledně spolehlivosti a věrohodnosti faktů Siebler odpověděl, že AI nebude vždy odpovídat správně, takže je nutné ji kontrolovat. Společnost Microsoft v současné době vytváří metriky důvěryhodnosti, které mají tento problém řešit. Zákazníci často využívají podporu AI pouze u svých vlastních datových sad, především pro čtení s porozuměním a dotazování na data o zásobách, kde jsou modely již poměrně přesné.

Text vygenerovaný modelem však zůstává generativní, a proto není snadno ověřitelný. „Vytváříme kolem generovaných textů smyčku zpětné vazby s palci nahoru a dolů,“ řekl Siebler – jedná se o iterativní proces. Sami uživatelé se tak budou dlouhodobě podílet na vylepšování kvality výstupů AI.

GPT-4, která byla představena v polovině března, je v mnoha ohledech revoluční. Její výstupy jsou ještě přesnější a multimodální, čímž se dále rozšíří oblasti, kde AI nachází uplatnění.

Zdroj: Microsoft
Aktualizováno: 16.3.2023

GPT-4 je tady: Zažíváme iPhone moment, umělá inteligence změní svět

Multimodální umělá inteligence

Jak se změní firmy kvůli AI?

Konkrétní příklady: Kde má dnes smysl umělou inteligenci nasadit?

Je AI spolehlivá?

O autorovi

Lukáš Voříšek

Multimodální umělá inteligence

Jak se změní firmy kvůli AI?

Konkrétní příklady: Kde má dnes smysl umělou inteligenci nasadit?

Je AI spolehlivá?

O autorovi

Lukáš Voříšek

Příbuzné příspěvky