Společnost OpenAI, známá především jako tvůrce ChatGPT, oznámila svůj nejnovější produkt: generativní AI model s kódovým označením Strawberry, oficiálně nazvaný OpenAI o1.
O1 není jen jeden model, ale celá rodina. Dva z nich jsou již dostupné: o1-preview a o1-mini, menší a efektivnější verze zaměřená na generování kódu. Tyto modely jsou od dnešního dne k dispozici pro předplatitele ChatGPT Plus a Team, zatímco podniky a vzdělávací instituce získají přístup začátkem příštího týdne.
Na rozdíl od svého předchůdce GPT-4o nemůže o1 zatím procházet web ani analyzovat soubory. Ačkoli má schopnosti pro analýzu obrázků, tyto funkce jsou dočasně deaktivovány kvůli dalším testům. Model je také omezen týdenními limity – aktuálně 30 zpráv pro o1-preview a 50 pro o1-mini.
Vyšší cena pro uživatele API
Jednou z nevýhod je cena. V API stojí o1-preview 15 dolarů za 1 milion vstupních tokenů a 60 dolarů za 1 milion výstupních tokenů. To je třikrát více za vstup a čtyřikrát více za výstup ve srovnání s GPT-4o. (Tokeny jsou segmenty textu; 1 milion tokenů odpovídá přibližně 700 000 slovům.)
OpenAI plánuje zpřístupnit o1-mini všem bezplatným uživatelům ChatGPT, ale datum vydání zatím nebylo stanoveno. Platící uživatelé, jak padlo výše, již modely mohou využívat v rámci svého předplatného.
Řetězec uvažování
Co dělá o1 skutečně výjimečným, je jeho schopnost „přemýšlet“ nad zadáním před odpovědí na dotazy. Díky delšímu času na zpracování dokáže model holisticky řešit úkoly – plánuje dopředu a provádí sérii kroků, které mu pomáhají dospět k přesnější odpovědi. To je obzvláště užitečné pro složité úkoly, jako je analýza právních dokumentů nebo tvorba marketingových strategií.
Noam Brown, výzkumný vědec v OpenAI, uvedl na platformě X, že „o1 je trénován pomocí posilovaného učení (reinforcement learning)“. Tento přístup učí model přemýšlet před odpovědí prostřednictvím řetězce úvah, kde je odměňován za správné odpovědi a trestán za chybné. Brown také zmínil, že čím déle o1 přemýšlí, tím lepší jsou jeho výsledky. I proto na rozdíl od ostatních modelů nedává svou odpověď hned.
Výkon v matematice a programování
Podle OpenAI dosáhl o1 v kvalifikačním testu pro Mezinárodní matematickou olympiádu (IMO) správného řešení u 83 % úloh, zatímco GPT-4o pouze u 13 %. V online programátorských soutěžích Codeforces dosáhl o1 na 89. percentil účastníků, čímž překonal i některé přední AI programovací systémy, jako je AlphaCode 2 od DeepMind.
GitHub, který testoval o1 s asistentem pro kódování GitHub Copilot, uvádí, že model exceluje v optimalizaci algoritmů a aplikací. OpenAI také uvádí zlepšení v multilingválních schopnostech, zejména v jazycích jako arabština a korejština.
Dokonalý ještě není
Navzdory svým pokročilým schopnostem má o1 i své nedostatky. Model je většinou zatím pomalejší než jeho předchůdci; některé odpovědi mohou trvat déle než 30 sekund. Také stále dochází k halucinacím, kdy model generuje nesprávné nebo smyšlené informace. V technickém dokumentu OpenAI přiznává, že o1 může halucinovat více než GPT-4o a méně často přiznává, když nezná odpověď.
Ethan Mollick, profesor managementu na Whartonu, který o1 testoval, uvedl: „Chyby a halucinace stále přetrvávají. Stále to není bezchybné.“
Konkurence nespí
OpenAI není jediným hráčem na poli pokročilých AI modelů. Google DeepMind nedávno publikoval studii ukazující, že zvýšením času a vedením modelů při plnění úkolů lze výrazně zlepšit jejich výkon bez dalších úprav.
OpenAI uvedla, že se rozhodla nezveřejňovat surové „řetězce uvažování“ o1 v ChatGPT, takže přesný postup uživatel nevidí. Dochází k tomu z důvodu konkurenční výhody. Místo toho zobrazuje „modelem generované shrnutí“ těchto procesů.
Ačkoli OpenAI s o1 možná předběhla konkurenci, skutečnou výzvou bude zpřístupnit tento model širší veřejnosti a snížit jeho cenu. Společnost také plánuje experimentovat s verzemi o1, které budou uvažovat hodiny, dny nebo dokonce týdny, aby dále zvýšila jejich schopnosti.
Zdroj: OpenAI