OpenAI odhalilo novou generaci svých modelů, GPT-5.6. Jde o trojici modelů s názvy Sol, Terra a Luna. Každý míří na jinou kombinaci výkonu a ceny. Má to ale háček. Vyzkoušet si je zatím může jen hrstka firem. Americká vláda totiž požádala OpenAI, aby start přibrzdilo, a firma vyhověla, byť nerada. Pojďme se nejdřív podívat, co GPT-5.6 vlastně umí. A pak na to, proč se k němu většina lidí hned tak nedostane.
Nový způsob pojmenování
OpenAI tentokrát změnilo logiku názvů. Číslo označuje generaci (5.6), jméno pak výkonnostní třídu. Sol stojí na vrcholu, Terra je vyvážená střední cesta, Luna je rychlá a s nízkou cenou. Každá třída se může posouvat svým tempem a nikdo se v tom nemusí ztrácet tolik jako dřív, kdy nálepky typu „Instant" moc neřekly.
Sol je nová vlajková loď a podle OpenAI výrazný skok oproti GPT-5.5. Firma ho popisuje jako svůj nejschopnější model, hlavně co se týče počítačové bezpečnosti. Vede ve všech srovnávacích testech, které OpenAI u nového vydání ukázalo.
Terra má být tahounem na běžnou každodenní práci. Výkonem se drží na úrovni předchozí vlajkové lodi GPT-5.5, ale za zhruba poloviční cenu. Možná tohle uvidíme i u dalších vydání: kvalita minulé špičky za cenu středního pásma.
Luna je nejrychlejší a nejlevnější. Cílí na velké objemy práce, na úlohy citlivé na rychlost odezvy a na ty, kdo si hlídají rozpočet. Pozor ale na to, že „nejlevnější" neznamená automaticky „nejslabší" v každé úloze.
Sol a jeho možnosti
Sol jako jediný odemyká dvě nová nastavení. První se jmenuje max a dává modelu víc času na přemýšlení nad složitým zadáním. Druhé je ultra, místo jednoho modelu, který úlohu řeší sám, rozdělí práci mezi takzvané podagenty, kteří pracují paralelně. To se hodí na dlouhé, vícekrokové úkoly, na které jeden agent v rámci jednoho kontextu nestačí.
A jak si Sol vede v testech? Nasadil nový nejlepší výsledek na Terminal-Benchu 2.1, který měří práci v příkazové řádce s nutností plánovat a koordinovat nástroje. Sol Ultra tu podle dostupných údajů dosáhl 91,9 procenta. Zlepšil se také na GeneBenchi v1 zaměřeném na genomiku a kvantitativní biologii, a to při spotřebě menšího počtu tokenů než GPT-5.5. A na ExploitBenchi, který testuje dlouhodobé hledání zranitelností, překonal starší modely.
OpenAI hodně mluvilo o bezpečnosti. Sol je prý trénovaný odmítat zakázanou pomoc v oblasti kyberútoků, i když se uživatel snaží svůj záměr zamaskovat nebo model obejít. Firma zároveň zdůrazňuje, že Sol lépe pomáhá zranitelnosti nacházet a opravovat, než aby spolehlivě prováděl útoky. Sol podle vlastního nastavení připravenosti prý nepřekračuje kritickou hranici v kybernetické oblasti.
Cena modelů
Ceny jsou za milion tokenů. Sol vyjde na 5 dolarů za vstup a 30 dolarů za výstup, což je skoro polovina ceny konkurenčního modelu Claude Fable 5 od Anthropicu (10 a 50 dolarů). Terra stojí 2,50 dolaru za vstup a 15 dolarů za výstup. Luna je nejlevnější, 1 dolar za vstup a 6 dolarů za výstup.
Na přístup si počkáme. Opět zasáhla vláda USA
OpenAI ukázalo špičkovou trojici modelů a vzápětí oznámilo, že je skoro nikdo nemůže používat, podobně jako tomu bylo u konkurenčního modelu Mythos po jeho oznámení. Přístup vede přes API a Codex, ale zatím jen pro malou skupinu prověřených partnerů. Podle dostupných informací jde zhruba o dvacet organizací. Veřejné pořadníky ani přihlášky zatím neexistují.
Důvodem je žádost americké vlády. Úřady národní kybernetické bezpečnosti požádaly OpenAI, aby start omezilo, dokud administrativa nedokončí systém na testování bezpečnosti nových modelů. Šéf OpenAI Sam Altman zaměstnancům sdělil, že vláda bude během náhledu schvalovat přístup zákazníka po zákazníkovi. Ještě poté, co OpenAI své plány s vysokými úředníky probralo, zavolal Altmanovi ministr obchodu Howard Lutnick a varoval firmu, ať nepostupuje bez souhlasu dalších úřadů.
Pozadím je výkonný příkaz, který prezident Trump podepsal na začátku června. Ten žádá špičkové laboratoře, aby své nejpokročilejší modely dobrovolně předkládaly vládě k posouzení až 30 dní před vydáním. Jenže případ OpenAI ukazuje, jak dobrovolné to ve skutečnosti je. Dean Ball, bývalý poradce Bílého domu pro umělou inteligenci a budoucí zaměstnanec OpenAI, mluví o tom, že příkaz fakticky vytvořil nedobrovolný licenční režim pro přední modely.
OpenAI vyhovělo, ale dalo jasně najevo, že se mu to nelíbí. „Nevěříme, že by se tenhle způsob vládního přístupu měl stát dlouhodobou normou," napsala firma v pátečním příspěvku. „Drží nejlepší nástroje dál od uživatelů, vývojářů, firem, obránců kyberprostoru i partnerů po celém světě, kteří je potřebují." Omezený náhled označilo OpenAI za krátkodobý krok na cestě k širší dostupnosti, která má přijít během několika týdnů. Firma zároveň s administrativou pracuje na novém postupu pro kybernetickou bezpečnost a na opakovatelném postupu pro budoucí vydání.
Není to první takový zásah. Jen pár týdnů předtím musel konkurenční Anthropic kvůli vládnímu nařízení o vývozních kontrolách vypnout přístup ke svým modelům Mythos 5 a Fable 5. Ve srovnání s tím dostalo OpenAI mírnější podmínky. V pátek navíc vláda jedno z omezení Anthropicu uvolnila a Mythos 5 se mohl vrátit k malé skupině obránců kyberprostoru.
OpenAI pro Euractiv potvrdilo, že všechny účastnické firmy náhledu sídlí ve Spojených státech. Žádná evropská firma ani úřad tedy zatím přístup nemá.
Zdroje: thehackernews.com a techcrunch.com
