OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Společnost OpenAI, známá především jako tvůrce ChatGPT, oznámila svůj nejnovější produkt: generativní AI model s kódovým označením Strawberry, oficiálně nazvaný OpenAI o1.

O1 není jen jeden model, ale celá rodina. Dva z nich jsou již dostupné: o1-preview a o1-mini, menší a efektivnější verze zaměřená na generování kódu. Tyto modely jsou od dnešního dne k dispozici pro předplatitele ChatGPT Plus a Team, zatímco podniky a vzdělávací instituce získají přístup začátkem příštího týdne.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

OpenAI je s 200 miliony aktivními uživateli ChatGPT lídrem na trhu s velkými jazykovými modely. Foto: Unsplash

Na rozdíl od svého předchůdce GPT-4o nemůže o1 zatím procházet web ani analyzovat soubory. Ačkoli má schopnosti pro analýzu obrázků, tyto funkce jsou dočasně deaktivovány kvůli dalším testům. Model je také omezen týdenními limity – aktuálně 30 zpráv pro o1-preview a 50 pro o1-mini.

Vyšší cena pro uživatele API

Jednou z nevýhod je cena. V API stojí o1-preview 15 dolarů za 1 milion vstupních tokenů a 60 dolarů za 1 milion výstupních tokenů. To je třikrát více za vstup a čtyřikrát více za výstup ve srovnání s GPT-4o. (Tokeny jsou segmenty textu; 1 milion tokenů odpovídá přibližně 700 000 slovům.)

OpenAI plánuje zpřístupnit o1-mini všem bezplatným uživatelům ChatGPT, ale datum vydání zatím nebylo stanoveno. Platící uživatelé, jak padlo výše, již modely mohou využívat v rámci svého předplatného.

Řetězec uvažování

Co dělá o1 skutečně výjimečným, je jeho schopnost „přemýšlet“ nad zadáním před odpovědí na dotazy. Díky delšímu času na zpracování dokáže model holisticky řešit úkoly – plánuje dopředu a provádí sérii kroků, které mu pomáhají dospět k přesnější odpovědi. To je obzvláště užitečné pro složité úkoly, jako je analýza právních dokumentů nebo tvorba marketingových strategií.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Zlepšení je patrné na pohled. Foto: Se souhlasem OpenAI

Noam Brown, výzkumný vědec v OpenAI, uvedl na platformě X, že „o1 je trénován pomocí posilovaného učení (reinforcement learning)“. Tento přístup učí model přemýšlet před odpovědí prostřednictvím řetězce úvah, kde je odměňován za správné odpovědi a trestán za chybné. Brown také zmínil, že čím déle o1 přemýšlí, tím lepší jsou jeho výsledky. I proto na rozdíl od ostatních modelů nedává svou odpověď hned.

Výkon v matematice a programování

Podle OpenAI dosáhl o1 v kvalifikačním testu pro Mezinárodní matematickou olympiádu (IMO) správného řešení u 83 % úloh, zatímco GPT-4o pouze u 13 %. V online programátorských soutěžích Codeforces dosáhl o1 na 89. percentil účastníků, čímž překonal i některé přední AI programovací systémy, jako je AlphaCode 2 od DeepMind.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

Foto: Se souhlasem OpenAI

GitHub, který testoval o1 s asistentem pro kódování GitHub Copilot, uvádí, že model exceluje v optimalizaci  algoritmů a aplikací. OpenAI také uvádí zlepšení v multilingválních schopnostech, zejména v jazycích jako arabština a korejština.

Dokonalý ještě není

Navzdory svým pokročilým schopnostem má o1 i své nedostatky. Model je většinou zatím pomalejší než jeho předchůdci; některé odpovědi mohou trvat déle než 30 sekund. Také stále dochází k halucinacím, kdy model generuje nesprávné nebo smyšlené informace. V technickém dokumentu OpenAI přiznává, že o1 může halucinovat více než GPT-4o a méně často přiznává, když nezná odpověď.

Obrázek: OpenAI představila nový AI model o1 s novým konceptem uvažování. Kde všude poráží lidi?

o1 se nad tématem déle zamyslí a měl by díky řetězci uvažování poskytnout lepší výsledky. Foto: Redakce inSmart.cz

Ethan Mollick, profesor managementu na Whartonu, který o1 testoval, uvedl: „Chyby a halucinace stále přetrvávají. Stále to není bezchybné.

Konkurence nespí

OpenAI není jediným hráčem na poli pokročilých AI modelů. Google DeepMind nedávno publikoval studii ukazující, že zvýšením času a vedením modelů při plnění úkolů lze výrazně zlepšit jejich výkon bez dalších úprav.

OpenAI uvedla, že se rozhodla nezveřejňovat surové „řetězce uvažování“ o1 v ChatGPT, takže přesný postup uživatel nevidí. Dochází k tomu z důvodu konkurenční výhody. Místo toho zobrazuje „modelem generované shrnutí“ těchto procesů.

Ačkoli OpenAI s o1 možná předběhla konkurenci, skutečnou výzvou bude zpřístupnit tento model širší veřejnosti a snížit jeho cenu. Společnost také plánuje experimentovat s verzemi o1, které budou uvažovat hodiny, dny nebo dokonce týdny, aby dále zvýšila jejich schopnosti.

Zdroj: OpenAI

Odebírat
Upozornit na
guest
0 Komentářů
nejstarší
nejnovější nejlépe hodnocené
Inline Feedbacks
View all comments
Tyto funkce Xiaomi 15 se vám na dovolené budou opravdu hodit
Amazon buduje konkurenci pro Starlink. Na oběžnou dráhu míří přes 3 200 satelitů
Obrázek: OMV a PRE v Česku postaví 113 ultrarychlých dobíjecích stanic s výkonem 300-400 kW
OMV a PRE v Česku postaví 113 ultrarychlých dobíjecích stanic s výkonem 300-400 kW
Obrázek: Televizi velkou přes celou stěnu už koupíte za 17 000 korun: TV od Xiaomi lákají na velikost i lákavé slevy
Televizi velkou přes celou stěnu už koupíte za 17 000 korun: TV od Xiaomi lákají na velikost i lákavé slevy
Trenér na zápěstí rozhýbe i lenochy. Jak běhat a cvičit s chytrými hodinkami Huawei Watch Fit 4?
Konec tajemství u telefonů: Energetické štítky odhalí vše o výdrži, opravitelnosti i odolnosti. Nebo ne?
Koupili jste si počítač od ASUSu? Nezapomeňte na registraci, získáte slevy, hry zdarma i rychlou podporu
Huawei Watch FIT 4 fungují s iPhonem. Stojí o polovinu méně než Apple Watch a v řadě ohledů jsou dokonce lepší