OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Společnost OpenAI, známá především jako tvůrce ChatGPT, oznámila svůj nejnovější produkt: generativní AI model s kódovým označením Strawberry, oficiálně nazvaný OpenAI o1.

O1 není jen jeden model, ale celá rodina. Dva z nich jsou již dostupné: o1-preview a o1-mini, menší a efektivnější verze zaměřená na generování kódu. Tyto modely jsou od dnešního dne k dispozici pro předplatitele ChatGPT Plus a Team, zatímco podniky a vzdělávací instituce získají přístup začátkem příštího týdne.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

OpenAI je s 200 miliony aktivními uživateli ChatGPT lídrem na trhu s velkými jazykovými modely. Foto: Unsplash

Na rozdíl od svého předchůdce GPT-4o nemůže o1 zatím procházet web ani analyzovat soubory. Ačkoli má schopnosti pro analýzu obrázků, tyto funkce jsou dočasně deaktivovány kvůli dalším testům. Model je také omezen týdenními limity – aktuálně 30 zpráv pro o1-preview a 50 pro o1-mini.

Vyšší cena pro uživatele API

Jednou z nevýhod je cena. V API stojí o1-preview 15 dolarů za 1 milion vstupních tokenů a 60 dolarů za 1 milion výstupních tokenů. To je třikrát více za vstup a čtyřikrát více za výstup ve srovnání s GPT-4o. (Tokeny jsou segmenty textu; 1 milion tokenů odpovídá přibližně 700 000 slovům.)

OpenAI plánuje zpřístupnit o1-mini všem bezplatným uživatelům ChatGPT, ale datum vydání zatím nebylo stanoveno. Platící uživatelé, jak padlo výše, již modely mohou využívat v rámci svého předplatného.

Řetězec uvažování

Co dělá o1 skutečně výjimečným, je jeho schopnost „přemýšlet“ nad zadáním před odpovědí na dotazy. Díky delšímu času na zpracování dokáže model holisticky řešit úkoly – plánuje dopředu a provádí sérii kroků, které mu pomáhají dospět k přesnější odpovědi. To je obzvláště užitečné pro složité úkoly, jako je analýza právních dokumentů nebo tvorba marketingových strategií.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Zlepšení je patrné na pohled. Foto: Se souhlasem OpenAI

Noam Brown, výzkumný vědec v OpenAI, uvedl na platformě X, že „o1 je trénován pomocí posilovaného učení (reinforcement learning)“. Tento přístup učí model přemýšlet před odpovědí prostřednictvím řetězce úvah, kde je odměňován za správné odpovědi a trestán za chybné. Brown také zmínil, že čím déle o1 přemýšlí, tím lepší jsou jeho výsledky. I proto na rozdíl od ostatních modelů nedává svou odpověď hned.

Výkon v matematice a programování

Podle OpenAI dosáhl o1 v kvalifikačním testu pro Mezinárodní matematickou olympiádu (IMO) správného řešení u 83 % úloh, zatímco GPT-4o pouze u 13 %. V online programátorských soutěžích Codeforces dosáhl o1 na 89. percentil účastníků, čímž překonal i některé přední AI programovací systémy, jako je AlphaCode 2 od DeepMind.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Foto: Se souhlasem OpenAI

GitHub, který testoval o1 s asistentem pro kódování GitHub Copilot, uvádí, že model exceluje v optimalizaci  algoritmů a aplikací. OpenAI také uvádí zlepšení v multilingválních schopnostech, zejména v jazycích jako arabština a korejština.

Dokonalý ještě není

Navzdory svým pokročilým schopnostem má o1 i své nedostatky. Model je většinou zatím pomalejší než jeho předchůdci; některé odpovědi mohou trvat déle než 30 sekund. Také stále dochází k halucinacím, kdy model generuje nesprávné nebo smyšlené informace. V technickém dokumentu OpenAI přiznává, že o1 může halucinovat více než GPT-4o a méně často přiznává, když nezná odpověď.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

o1 se nad tématem déle zamyslí a měl by díky řetězci uvažování poskytnout lepší výsledky. Foto: Redakce inSmart.cz

Ethan Mollick, profesor managementu na Whartonu, který o1 testoval, uvedl: „Chyby a halucinace stále přetrvávají. Stále to není bezchybné.

Konkurence nespí

OpenAI není jediným hráčem na poli pokročilých AI modelů. Google DeepMind nedávno publikoval studii ukazující, že zvýšením času a vedením modelů při plnění úkolů lze výrazně zlepšit jejich výkon bez dalších úprav.

OpenAI uvedla, že se rozhodla nezveřejňovat surové „řetězce uvažování“ o1 v ChatGPT, takže přesný postup uživatel nevidí. Dochází k tomu z důvodu konkurenční výhody. Místo toho zobrazuje „modelem generované shrnutí“ těchto procesů.

Ačkoli OpenAI s o1 možná předběhla konkurenci, skutečnou výzvou bude zpřístupnit tento model širší veřejnosti a snížit jeho cenu. Společnost také plánuje experimentovat s verzemi o1, které budou uvažovat hodiny, dny nebo dokonce týdny, aby dále zvýšila jejich schopnosti.

Zdroj: OpenAI

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Kingston Dual Portable SSD je disk, který nepotřebuje kabely
AI ve videoherním průmyslu? Špatný kreativní tvůrce, což je štěstí, říká vývojář
Obrázek: Automobilka Chery je nováčkem na českém trhu. Zatím má jen spalovací a hybridní SUV, ale s cenou pod milion
Automobilka Chery je nováčkem na českém trhu. Zatím má jen spalovací a hybridní SUV, ale s cenou pod milion
Obrázek: Black Friday u Xiaomi: Aktuálně ušetříte tisíce korun nejen za smartphony, chytrá televize spadla pod 12 000 Kč
Black Friday u Xiaomi: Aktuálně ušetříte tisíce korun nejen za smartphony, chytrá televize spadla pod 12 000 Kč
Samsung Black Friday: Až 50 000 Kč sleva na televize a 40% bonus při nákupu dvou produktů
Foťte mobilem jako profesionál. Tipy a triky na focení s Xiaomi 15T Pro
Google varuje před obřím únikem dat. 2,5 miliardy uživatelů Gmailu v ohrožení
Jste opravdový Applista? Těchto pět tipů by měl znát každý majitel iPhonu