Vrátit se na blog

Blog /

AI /

OpenAI představuje GPT-5.3-Codex: První AI model, který se podílel na vlastním vývoji

Ondřej Barták

podnikatel a programátor

9. 2. 2026

4 minut čtení

Poslechněte si článek

Audio verze článku

OpenAI představilo nový model GPT-5.3-Codex, který představuje zásadní milník ve vývoji umělé inteligence. Jde o první model společnosti, který hrál klíčovou roli na svém vlastním vzniku. Tým Codex používal první verze modelu k ladění vlastního trénování, správě vlastního nasazení a diagnostice výsledků testů. Podle OpenAI byl tým ohromen tím, jak moc dokázal Codex urychlit svůj vlastní vývoj.

GPT-5.3-Codex kombinuje výkonnost hraničního kódování předchozího modelu GPT-5.2-Codex se schopností uvažování a odbornými znalostmi GPT-5.2, a to vše v jednom modelu, který je navíc o 25 % rychlejší. Model dokáže převzít dlouhodobé úkoly, které zahrnují výzkum, používání nástrojů a složité spouštění.

Špičkový výkon v testech

GPT-5.3-Codex dosáhl nového oborového maxima v několika klíčových testech. V testu SWE-Bench Pro dosáhl 56,8 %, což je přísné hodnocení reálného softwarového vývoje. Na rozdíl od SWE-bench Verified, který testuje pouze Python, SWE-Bench Pro zahrnuje čtyři jazyky.

V testu Terminal-Bench 2.0, který měří dovednosti s terminálem potřebné pro kódovacího agenta, dosáhl model 77,3 %, což je výrazné zlepšení oproti GPT-5.2-Codex s 64,0 %. Model to navíc zvládá s menším počtem tokenů než jakýkoli předchozí model.

V testu OSWorld-Verified, který měří schopnosti používání počítače, dosáhl GPT-5.3-Codex 64,7 %, zatímco GPT-5.2-Codex pouze 38,2 %. Lidé v tomto testu dosahují přibližně 72 %.

Tvorba komplexních her a aplikací

Model dokáže během několika dní vytvořit vysoce funkční komplexní hry a aplikace od nuly. OpenAI požádalo GPT-5.3-Codex, aby vytvořil dvě hry: závodní hru s různými závodníky, osmi mapami a předměty, které lze používat pomocí mezerníku, a potápěčskou hru, ve které hráči prozkoumávají různé útesy, sbírají ryby do kodexu a dávají si pozor na kyslík, tlak a nebezpečí. Model postupně vylepšoval hry autonomně přes miliony tokenů pomocí obecných následných promptů jako „oprav chybu" nebo „vylepši hru".

GPT-5.3-Codex se mění z agenta, který umí psát a kontrolovat kód, na agenta, který dokáže na počítači dělat téměř cokoli, co umí vývojáři a profesionálové. Model je vytvořen tak, aby podporoval všechny práce v životním cyklu softwaru – ladění, nasazení, monitorování, psaní PRD, úpravy kopií, průzkum uživatelů, testy, metriky a další. Agentské schopnosti přesahují rámec softwaru a pomohou vytvořit cokoli – ať už jde o prezentace nebo analýzu dat v tabulkách. V hodnocení GDPval, které měří výkonnost modelu v přesně specifikovaných znalostních úlohách ve 44 profesích, se GPT-5.3-Codex vyrovná GPT-5.2 s 70,9 %.

Interaktivní spolupracovník

Model poskytuje časté aktualizace, takže uživatelé mají přehled o klíčových rozhodnutích a pokroku v průběhu práce. Místo čekání na konečný výstup lze komunikovat v reálném čase – klást otázky, diskutovat o přístupech a směrovat k řešení. GPT-5.3-Codex vysvětluje, co dělá, reaguje na zpětnou vazbu a udržuje uživatele v obraze od začátku do konce.

GPT-5.3-Codex je první model, který OpenAI klasifikuje jako vysoce schopný pro úkoly související s kybernetickou bezpečností v rámci svého Rámce připravenosti. Jde také o první model, který byl přímo trénován k identifikaci softwarových zranitelností.

OpenAI nasazuje dosud nejkomplexnější bezpečnostní sadu kybernetické bezpečnosti. Opatření zahrnují bezpečnostní školení, automatizované monitorování, důvěryhodný přístup k pokročilým funkcím a postupy vynucování včetně zpravodajských informací o hrozbách. Společnost spouští Důvěryhodný přístup pro kybernetickou obranu, pilotní program zaměřený na urychlení výzkumu kybernetické obrany. OpenAI také vyčleňuje 10 milionů dolarů (přibližně 205 milionů Kč) v kreditech na rozhraní API na urychlení kybernetické obrany pomocí nejschopnějších modelů.

Silná konkurence

Zajímavostí je, že téhož dne společnost Anthropic představila svůj model Claude Opus 4.6. Podle analýzy publikované na Every.to došlo k vydání obou modelů v rozmezí pouhých desítek minut. Anthropic dokonce posunul plánované vydání z 10:00 na 9:45 PST, zatímco GPT-5.3-Codex byl spuštěn v 10:01.

Podle testů provedených týmem Every dochází k konvergenci obou modelů. Opus 4.6 získal důkladný a precizní styl, který dělal z Codexu preferovanou volbu pro náročné kódovací úkoly. GPT-5.3-Codex zase přidal rychlost a ochotu jednoduše věci dělat bez neustálého ptaní se na povolení. Podle testů týmu Every má Opus 4.6 vyšší strop jako model, ale také vyšší varianci. Je více paralelizovaný a kreativnější. Jeden člen týmu ho použil na funkci pro aplikaci Monologue, na které tým pracoval dva měsíce – model ji prostě postavil. Opus však někdy hlásí úspěch, když ve skutečnosti selhal, nebo provádí změny, o které nebylo požádáno.

GPT-5.3-Codex je excelentní model se spolehlivějším výstupem. Je velmi chytrý a dokáže pracovat autonomně po dlouhé období na obtížných kódovacích úkolech. Je velmi rychlý – rychlejší než Opus – a nedělá hloupé chyby, které Opus dělá.

Dostupnost

GPT-5.3-Codex je k dispozici s placenými plány ChatGPT všude, kde lze používat Codex: v aplikaci, rozhraní příkazového řádku, rozšíření IDE a na webu. OpenAI pracuje na tom, aby brzy bezpečně zpřístupnilo rozhraní API.

Kategorie: AI