OpenAI právě spustilo novou rodinu modelů nazvanou GPT-5.2, která přichází ve třech verzích: Instant, Thinking a Pro. Tento model je navržený tak, aby pomáhal lidem v práci, například při tvorbě tabulek, prezentací nebo psaní kódu. Podle Fidji Simo, šéfky produktů v OpenAI, je GPT-5.2 lepší v porozumění obrázkům, dlouhým textům a složitým projektům, které vyžadují více kroků. Firma to oznámila 11. prosince 2025 na svém blogu, kde zdůraznila, že model dokáže zpracovat až 400 000 tokenů najednou – to znamená, že zvládne analyzovat stovky dokumentů současně. Znalosti modelu končí u dat z 31. srpna 2025, takže je aktuální pro většinu letošních událostí.
Verze Instant je rychlá na jednoduché úkoly, jako je psaní textů nebo překlady. Thinking přidává simulované myšlení pro složitější věci, jako je matematika nebo programování, a Pro je nejpřesnější varianta pro náročné problémy.
Urychlené vydání
Vydání přichází po interním memorandu od CEO Sam Altmana, ve kterém označil situaci jako "code red" kvůli tlaku od Googlu. Google totiž nedávno představil model Gemini 3, který překonal některé benchmarky a získal 200 milionů uživatelů za tři měsíce. OpenAI na to reagovalo tím, že odložilo jiné plány, jako je reklama v ChatGPT, a soustředilo se na vylepšení svého chatbota. OpenAI 800 milionů týdenních aktivních uživatelů ChatGPT, zatímco Google Gemini jich má 650 milionů. Firma OpenAI investovala do infrastruktury 1,4 bilionu dolarů (přibližně 32,2 bilionu Kč), aby udržela náskok.
Toto je třetí velké vydání modelu od srpna 2025. GPT-5 vyšlo v srpnu s přepínáním mezi rychlými odpověďmi a myšlením, ale uživatelé si stěžovali na chladné odpovědi. V listopadu přišlo GPT-5.1 s osmi osobnostmi pro lepší konverzace. Ale kvalita odpovědí výrazně klesla dle mnoha uživatelů a ti začali přecházet ke konkurenci. Nyní GPT-5.2 přináší další zlepšení, jako je méně chyb – podle Maxe Schwarzer z OpenAI model halucinuje o 38 % méně než GPT-5.1.
Jak si GPT-5.2 vede v testech?
Model dosáhl skvělých výsledků v mnoha testech. Na benchmarku GDPval, který měří úkoly z 44 profesí, GPT-5.2 Thinking překonal nebo se vyrovnal profesionálům v 70,9 % případů. To zahrnuje tvorbu prezentací, tabulek nebo diagramů, a dělá to 11krát rychleji a za méně než 1 % ceny lidského experta. Na SWE-Bench Pro pro softwarové inženýrství dosáhl 55,6 %, což je lepší než 43,3 % u Gemini 3 Pro a 52,0 % u Claude Opus 4.5.
V testu GPQA Diamond na vědecké otázky dosáhl GPT-5.2 Thinking 92,4 %, těsně před 91,9 % Gemini 3 Pro. Na matematickém testu AIME 2025 dosáhl 100 %, na FrontierMath (úrovně 1–3) 40,3 % a na úrovni 4 pak 14,6 %. V abstraktním uvažování ARC-AGI-1 (Verified) má 86,2 %, v ARC-AGI-2 pak 52,9 %. Pro zrakové úkoly, jako je čtení grafů, snížil chyby na polovinu – na CharXiv Reasoning dosáhl 88,7 % s nástrojem Python.
Model je také lepší v dlouhých kontextech, kde zvládne informace z 256 000 tokenů s téměř 100 % přesností v některých testech. V nástrojovém použití na Tau2-bench Telecom dosáhl 98,7 %, což znamená spolehlivé řešení zákaznických požadavků přes více kol.
Dostupnost a ceny pro uživatele
GPT-5.2 je dostupný v ChatGPT pro placené plány Plus, Pro, Business nebo Enterprise od 11. prosince 2025. Starší GPT-5.1 zůstane dostupný tři měsíce v menu legacy models. V API pro vývojáře stojí GPT-5.2 1,75 dolaru (přibližně 40 Kč) za milion vstupních tokenů, což je o 40 % více než u GPT-5.1, ale s 90 % slevou na cachované vstupy. Výstupní tokeny stojí 14 dolarů (přibližně 322 Kč) za milion. GPT-5.2 Pro je dražší: 21 dolarů (přibližně 483 Kč) za milion vstupů a 168 dolarů (přibližně 3 864 Kč) za milion výstupů.
Firma spolupracuje s Nvidí a Microsoftem a využívá jejich hardware, jako je GPU H100, H200 nebo GB200-NVL72. Bezpečnost je vylepšená – model lépe reaguje na citlivé témata jako sebevražda nebo duševní zdraví, s méně než 1 % nežádoucích odpovědí v testech. OpenAI plánuje zavést predikci věku uživatelů pro ochranu mladších pod 18 let.
GPT-5.2 v praxi
GPT-5.2 umožňuje snažší práci s dokumenty, obrázky nebo kódy. Například dokáže analyzovat screenshoty rozhraní s 86,3 % přesností na ScreenSpot-Pro, nebo řešit matematické problémy s nástroji. V zákaznické podpoře zvládne složité scénáře, jako je zpožděný let s požadavky na ubytování a speciální sedadlo, kde koordinuje rebooking a kompenzace. Model je největším skokem v agentickém kódování od GPT-5 a funguje spolehlivě i s jednoduchými pokyny.
