o1 přemýšlí déle, ale dává přesnější výsledky: OpenAI představila nový AI model

Společnost OpenAI, známá především jako tvůrce ChatGPT, oznámila svůj nejnovější produkt: generativní AI model s kódovým označením Strawberry, oficiálně nazvaný OpenAI o1.

O1 není jen jeden model, ale celá rodina. Dva z nich jsou již dostupné: o1-preview a o1-mini, menší a efektivnější verze zaměřená na generování kódu. Tyto modely jsou od dnešního dne k dispozici pro předplatitele ChatGPT Plus a Team, zatímco podniky a vzdělávací instituce získají přístup začátkem příštího týdne.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

OpenAI je s 200 miliony aktivními uživateli ChatGPT lídrem na trhu s velkými jazykovými modely. Foto: Unsplash

Na rozdíl od svého předchůdce GPT-4o nemůže o1 zatím procházet web ani analyzovat soubory. Ačkoli má schopnosti pro analýzu obrázků, tyto funkce jsou dočasně deaktivovány kvůli dalším testům. Model je také omezen týdenními limity – aktuálně 30 zpráv pro o1-preview a 50 pro o1-mini.

Vyšší cena pro uživatele API

Jednou z nevýhod je cena. V API stojí o1-preview 15 dolarů za 1 milion vstupních tokenů a 60 dolarů za 1 milion výstupních tokenů. To je třikrát více za vstup a čtyřikrát více za výstup ve srovnání s GPT-4o. (Tokeny jsou segmenty textu; 1 milion tokenů odpovídá přibližně 700 000 slovům.)

OpenAI plánuje zpřístupnit o1-mini všem bezplatným uživatelům ChatGPT, ale datum vydání zatím nebylo stanoveno. Platící uživatelé, jak padlo výše, již modely mohou využívat v rámci svého předplatného.

Řetězec uvažování

Co dělá o1 skutečně výjimečným, je jeho schopnost „přemýšlet“ nad zadáním před odpovědí na dotazy. Díky delšímu času na zpracování dokáže model holisticky řešit úkoly – plánuje dopředu a provádí sérii kroků, které mu pomáhají dospět k přesnější odpovědi. To je obzvláště užitečné pro složité úkoly, jako je analýza právních dokumentů nebo tvorba marketingových strategií.

Zlepšení je patrné na pohled. Foto: Se souhlasem OpenAI

Noam Brown, výzkumný vědec v OpenAI, uvedl na platformě X, že „o1 je trénován pomocí posilovaného učení (reinforcement learning)“. Tento přístup učí model přemýšlet před odpovědí prostřednictvím řetězce úvah, kde je odměňován za správné odpovědi a trestán za chybné. Brown také zmínil, že čím déle o1 přemýšlí, tím lepší jsou jeho výsledky. I proto na rozdíl od ostatních modelů nedává svou odpověď hned.

Výkon v matematice a programování

Podle OpenAI dosáhl o1 v kvalifikačním testu pro Mezinárodní matematickou olympiádu (IMO) správného řešení u 83 % úloh, zatímco GPT-4o pouze u 13 %. V online programátorských soutěžích Codeforces dosáhl o1 na 89. percentil účastníků, čímž překonal i některé přední AI programovací systémy, jako je AlphaCode 2 od DeepMind.

Foto: Se souhlasem OpenAI

GitHub, který testoval o1 s asistentem pro kódování GitHub Copilot, uvádí, že model exceluje v optimalizaci algoritmů a aplikací. OpenAI také uvádí zlepšení v multilingválních schopnostech, zejména v jazycích jako arabština a korejština.

Dokonalý ještě není

Navzdory svým pokročilým schopnostem má o1 i své nedostatky. Model je většinou zatím pomalejší než jeho předchůdci; některé odpovědi mohou trvat déle než 30 sekund. Také stále dochází k halucinacím, kdy model generuje nesprávné nebo smyšlené informace. V technickém dokumentu OpenAI přiznává, že o1 může halucinovat více než GPT-4o a méně často přiznává, když nezná odpověď.

o1 se nad tématem déle zamyslí a měl by díky řetězci uvažování poskytnout lepší výsledky. Foto: Redakce inSmart.cz

Ethan Mollick, profesor managementu na Whartonu, který o1 testoval, uvedl: „Chyby a halucinace stále přetrvávají. Stále to není bezchybné.“

Konkurence nespí

OpenAI není jediným hráčem na poli pokročilých AI modelů. Google DeepMind nedávno publikoval studii ukazující, že zvýšením času a vedením modelů při plnění úkolů lze výrazně zlepšit jejich výkon bez dalších úprav.

OpenAI uvedla, že se rozhodla nezveřejňovat surové „řetězce uvažování“ o1 v ChatGPT, takže přesný postup uživatel nevidí. Dochází k tomu z důvodu konkurenční výhody. Místo toho zobrazuje „modelem generované shrnutí“ těchto procesů.

Ačkoli OpenAI s o1 možná předběhla konkurenci, skutečnou výzvou bude zpřístupnit tento model širší veřejnosti a snížit jeho cenu. Společnost také plánuje experimentovat s verzemi o1, které budou uvažovat hodiny, dny nebo dokonce týdny, aby dále zvýšila jejich schopnosti.

Zdroj: OpenAI

OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Vyšší cena pro uživatele API

Řetězec uvažování

Výkon v matematice a programování

Dokonalý ještě není

Konkurence nespí

O autorovi

Lukáš Voříšek

Vyšší cena pro uživatele API

Řetězec uvažování

Výkon v matematice a programování

Dokonalý ještě není

Konkurence nespí

O autorovi

Lukáš Voříšek

Příbuzné příspěvky