OpenAI představuje GPT-OSS: První otevřený AI model od dob GPT2

OpenAI, společnost známá svými pokročilými modely jako GPT-4o nebo o3, teď otevírá brány k něčemu opravdu velkému. Představili dva nové open-weight modely: gpt-oss-120b a gpt-oss-20b. Tyto modely nejsou jen dalšími kousky kódu – jsou navržené tak, aby posunuly hranice toho, co otevřené modely dokážou v oblasti uvažování, používání nástrojů a efektivního nasazení. A co je nejlepší? Jsou dostupné pod flexibilní licencí Apache 2.0, takže je může kdokoli stáhnout, upravit a používat. Pojďme se na to podívat podrobněji, krok za krokem.

Co jsou gpt-oss modely a proč jsou důležité?

Tyto modely jsou trénované pomocí směsi posilovacího učení (reinforcement learning) a technik inspirovaných nejvyspělejšími interními systémy OpenAI, včetně o3 a dalších frontier modelů. gpt-oss-120b má celkem 117 miliard parametrů, ale aktivuje jen 5,1 miliardy na token, což ho činí efektivním – běží na jediné 80 GB GPU. Menší gpt-oss-20b má 21 miliard parametrů s 3,6 miliardami aktivními na token a stačí mu jen 16 GB paměti, ideální pro zařízení na hraně (edge devices) nebo lokální inference bez drahé infrastruktury.

Oba modely vynikají v úkolech jako uvažování v řetězci myšlenek (chain-of-thought reasoning), používání nástrojů jako webové vyhledávání nebo spouštění Python kódu, a dokonce podporují strukturované výstupy (Structured Outputs). Jsou kompatibilní s Responses API od OpenAI a umožňují nastavení úrovně uvažování – nízké, střední nebo vysoké – podle potřeby latency versus výkonu. V benchmarkách jako Codeforces, MMLU, HLE, Tau-Bench nebo HealthBench překonávají nebo se vyrovnávají modelům jako o3-mini a o4-mini, například v soutěžním programování, matematice (AIME 2024 & 2025) nebo zdravotních dotazech.

Codeforces Health Bench

OpenAI spolupracovalo s partnery jako AI Sweden, Orange a Snowflake, aby otestovali reálné aplikace – od hostování na místě pro bezpečnost dat po fine-tuning na specializovaných datasetech. To znamená, že tyto modely nejsou jen teoretické; jsou připravené pro vývojáře, firmy i vlády, kteří chtějí AI běžet na vlastní infrastruktuře.

MMLU

Architektura a trénink

Modely jsou založené na Transformer architektuře s mixture-of-experts (MoE), kde gpt-oss-120b má 36 vrstev, 128 expertů a aktivuje 4 na token. gpt-oss-20b má 24 vrstev, 32 expertů a také 4 aktivní. Používají střídavé vzory pozornosti (dense a locally banded sparse), grouped multi-query attention s velikostí skupiny 8, a Rotary Positional Embedding (RoPE) pro kontext až 128k tokenů.

Porovnání modelů

Trénink probíhal na převážně anglickém textovém datasetu se zaměřením na STEM, kódování a obecnou znalost. Použili tokenizer o200k_harmony, který také otevřeli. Post-trénink zahrnoval supervizované fine-tuning a RL fázi, aby modely dodržovaly OpenAI Model Spec, včetně CoT uvažování a nástrojového použití. OpenAI zdůrazňuje, že CoT není přímo supervizováno, což umožňuje lepší monitorování chování modelu.

Bezpečnost na prvním místě

Bezpečnost je klíčová, zvláště u otevřených modelů. OpenAI filtrovalo škodlivá data během pre-tréninku (např. CBRN – chemické, biologické, radiologické a nukleární) a použilo deliberative alignment a instruction hierarchy pro odmítání nebezpečných promptů. Navíc otestovali adversariálně fine-tuned verzi gpt-oss-120b podle Preparedness Framework, a výsledky ukázaly, že i po takové úpravě nedosahují vysokých rizikových úrovní. Tato metodika byla revidována externími experty, a OpenAI sdílí detaily v research paper a model card.

Aby podpořili komunitu, spustili Red Teaming Challenge na Kaggle s fondem 500 000 dolarů na identifikaci nových bezpečnostních rizik. To ukazuje, jak OpenAI bere otevřené modely vážně a chce přispět k bezpečnějšímu ekosystému.

Dostupnost a jak začít

Modely jsou ke stažení na Hugging Face, kvantizované v MXFP4 pro efektivitu. Podporují harmony prompt format, a OpenAI otevřelo renderer v Pythonu a Rustu. Jsou optimalizované pro platformy jako Azure, Hugging Face, vLLM, Ollama, llama.cpp, AWS, Fireworks, Together AI, Baseten, Databricks, Vercel, Cloudflare a OpenRouter. Na hardware straně spolupracovali s NVIDIA, AMD, Cerebras a Groq. Microsoft přináší GPU-optimalizované verze pro Windows přes ONNX Runtime.

Pro ty, kdo chtějí experimentovat, je tu open model playground a průvodce v cookbooku. OpenAI zdůrazňuje, že tyto modely doplňují jejich API modely pro ty, kdo potřebují multimodalitu nebo vestavěné nástroje.

Uživatelské recenze: Co říkají lidé?

Teď k tomu, co říkají skuteční uživatelé – na základě komentářů a recenzí z fór jako community.openai.com, G2, Slashdot nebo The Algorithmic Bridge. Například vývojáři oceňují, jak model exceluje v komplexních úkolech jako kódování, vědecké problémy nebo pokročilá matematika – často překonává GPT-4 v benchmarkách a praktických testech. Jeden uživatel na G2 řekl, že je to "významný booster produktivity" díky strukturovaným výstupům jako JSON a snadné dostupnosti přes ChatGPT Plus nebo API. Experti oceňují jeho výkon v logickém uvažování a kreativním řešení problémů, což ho činí ideálním pro profesionální a technické použití.

Na druhé straně, záporné komentáře se soustředí na pomalejší odezvy kvůli důkladnějšímu uvažování – někteří uživatelé na community.openai.com si stěžují, že to vyžaduje úpravu workflow, aby se přizpůsobili delším časům zpracování. Nováčci v AI často zmiňují strmou křivku učení, protože pokročilé funkce mohou být příliš složité. Další obavy se týkají omezení přístupu k preview verzím nebo organizačním restrikcím. Jeden recenzent na Slashdot poznamenal, že i přes výkon je třeba být připraven na "vyšší složitost a pomalejší rychlost", což nemusí vyhovovat každému.

Celkově se zdá, že gpt-oss modely jsou vnímány jako velký krok vpřed, ale s nutností vyvážit výkon a praktičnost. OpenAI tak pomáhá demokratizovat AI, dává nástroje do rukou všem – od individuálních vývojářů po velké firmy. Co na to říkáte vy? Pokud jste zvědaví, zkuste si je sami na Hugging Face!

Kategorie: AI