Čínská společnost ByteDance přiznala, že během vývoje vlastního velkého jazykového modelu použila technologii OpenAI, čímž porušila zásady společnosti. Obhajuje se, že šlo o „velmi omezené využití“. Americký leader v oblasti AI nyní celou věc prozkoumává.
Před několika dny server The Verge v článku obvinil společnost ByteDance z toho, že během tréningu vlastního jazykového modelu používá technologii OpenAI. V tom případě se podle webu jedná o přímé porušení podmínek americké firmy.
Mateřská společnost TikToku to nyní přiznala, upozornila televize CNN. Její mluvčí sdělil, že používá ve velmi omezené míře GPT API k podpoře produktů a funkcí na trzích mimo Čínu, v níž nejsou služby OpenAI dostupné.
API je zkratka pro „application programming interface“ – rámec umožňující programům komunikovat ve vzájemné propojenosti. ByteDance používá GPT ve velmi omezené míře s dalšími modely třetích stran během procesů testování a hodnocení.
Mluvčí ByteDance ubezpečil, že Doubao, nástroj podobný ChatGPT, pohání model umělé inteligence společnosti dostupný jen v Číně. Jelikož OpenAI zakazuje používat uživatelům k vývoji vlastní AI výstupy ChatGPT, celou věc prošetřuje.
Velké pochybení
Společnost se sídlem v San Franciscu se k tomu vyjádřila tak, že využití GPT skutečně bylo v případě ByteDance velmi omezené, musí však firmě ke své službě dočasně pozastavit přístup, dokud celou věc neprošetří.
„Všichni uživatelé API musejí dodržovat naše zásady, abychom zajistili, že bude naše technologie používána pro správné účely. Přestože bylo užití API v případě ByteDance minimální, pozastavili jsme jejich účet, zatímco bude probíhat vyšetřování,“ uvedla firma.
A její prohlášení pokračovalo takto: „Pokud zjistíme, že použití API nebylo v souladu s našimi zásadami, společnost požádáme, aby provedla nezbytné změny nebo přestala používat svůj účet.“ The Verge napsal, že ByteDance používala API v téměř každé fázi vývoje svého modelu.
Odkazoval přitom přímo na její interní dokumenty. ByteDance vyvíjí vlastní jazykový model pod označením Project Seed. Přidávat výstupy GPT do tréninkových datových sad vlastních jazykových modelů zakázala již v dubnu.