Čínský startup DeepSeek oznámil, že plánovaná akční sleva 75 % na jeho vlajkový model V4 Pro nebude dočasná. Zůstane natrvalo. Ceny pro vývojáře tak klesly na čtvrtinu původní hodnoty a čínská firma nyní cenově podráží prakticky všechny největší západní poskytovatele umělé inteligence.
Od dočasné akce k trvalé ceně
Když DeepSeek v dubnu 2026 spustil model V4 Pro, rovnou přiznal, že ceny jsou dočasně vyšší. Důvod? Omezená dostupnost výpočetního výkonu. Firma tehdy otevřeně napsala, že Pro verze bude stát až dvanáctkrát více než méně výkonná verze Flash, a to kvůli nedostatku špičkových čipů. Zároveň naznačila, že ceny výrazně klesnou, jakmile Huawei vypustí na trh výpočetní uzle Ascend 950 ve větším množství. Následně přišla sleva 75 %. Původně měla platit jen do konce května. DeepSeek ji ale 23. května prohlásil za trvalou.
Nové ceny se pohybují mezi 0,025 a 6 jüany za milion tokenů, tedy zhruba od 0,0035 do 0,83 amerického dolaru. Původní sazby přitom dosahovaly 0,1 až 24 jüanů.
GPT-5 od OpenAI si účtuje 2,50 dolaru za milion vstupních tokenů a 10 dolarů za výstupní. Anthropic za svůj model Claude Opus 4.7 požaduje 5 dolarů na vstupu a rovných 25 dolarů na výstupu. Google Gemini 3.5 Flash, tedy jeho cenově úspornější varianta, stojí 0,15 dolaru na vstupu a 0,60 dolaru na výstupu.
DeepSeek V4 Pro za trvalých cen leží pod všemi těmito hodnotami. Největší rozdíl je patrný u frontových modelů určených pro náročné firemní nasazení, kde se spotřeba tokenů násobí nejrychleji. Salesforce odhaduje, že letos utratí přes 300 milionů dolarů jen za tokeny u Anthropicu. Při cenách DeepSeeku by totéž množství vyšlo na zlomek.
Huawei v pozadí, Washington v obraze
DeepSeek neuvedl, zda trvale nižší ceny přímo souvisí s rostoucí dostupností čipů Huawei Ascend 950. Jisté nicméně je, že V4 byl od začátku stavěn na těchto čipech a firma jejich vliv na výkon modelu nijak neskrývá.
Huawei se těší rostoucí poptávce právě proto, že americká vývozní omezení znemožňují Nvidii prodávat nejpokročilejší čipy na čínský trh. Jenže stejná omezení dopadají i na výrobní zařízení pro čipy samotné, takže Huawei má potíže výrazně navýšit produkci čipů Ascend. Jak rychle se situace změní, zatím není jasné.
Antropic od konce roku 2025 do dubna 2026 zvýšil roční obrat z 9 na 30 miliard dolarů, z velké části díky firemnímu nasazení nástroje Claude Code. DeepSeek teď útočí právě na tento segment.
Podle analytiků začnou firmy méně náročné úlohy posílat DeepSeeku, zatímco pro nejcitlivější a nejsložitější dotazy zůstanou u Claude nebo GPT-5. To by znamenalo, že celkový objem tokenů u Anthropicu nebo OpenAI neklesne, ale klesne průměrná cena za token. A to je přesně ta část, která drží valuace.
OpenAI mezitím přidává spotřebitelské funkce, třeba nástroje pro osobní finance, a zkouší postavit byznys model méně závislý na příjmech z API. Při valuaci přes 850 miliard dolarů si nemůže dovolit čekat, jak cenová válka dopadne.
Výhoda, která má svou cenu
Rozhodnutí přijmout DeepSeek V4 Pro není pro technické ředitele žádnou jednoduchou rovnicí. Model nabízí kontextové okno o délce milionu tokenů za ceny, které nemají u frontových modelů konkurenci. To je atraktivní pro zpracování rozsáhlých dokumentů, právní rešerše nebo analýzu kódu, tedy přesně tam, kde se vstupní náklady rychle sčítají.
Na druhé straně stojí geopolitická citlivost. Směrování firemních dat přes čínského poskytovatele přináší otázky ohledně souladu s předpisy, ochrany dat a provozní spolehlivosti. Ve vládním sektoru nebo v regulovaných odvětvích jako jsou finance či zdravotnictví jde o faktor, který rozhodnutí zásadně komplikuje.
Anthropic navíc veřejně obvinil DeepSeek z takzvaných "distilačních útoků", tedy z toho, že DeepSeek trénoval své modely na výstupech Claudu, aby zlepšil vlastní výkon. DeepSeek se k obvinění podrobně nevyjádřil. Kdyby se to potvrdilo, DeepSeek by svou cenovou výhodu stavěl z části na cizím výzkumu, za který nikdy nezaplatil.
Cena má přivést co největší objem použití bez ohledu na marži za každý token. Firma ve svém prohlášení V4 popsala jako uvítání "éry cenově dostupného kontextového okna délky jednoho milionu tokenů". Jde o přímý vzkaz vývojářům, kteří dosud na tokeny šetřili.
Zda tato strategie zafunguje i mimo čínský trh, záleží na tom, jak rychle dokáže konkurence zareagovat. Google opakovaně snižoval ceny Gemini, aby čelil otevřeným modelům. Ani OpenAI ani Anthropic ale zatím nepřistoupily na podobně dramatický krok.
Zdroje: bloomberg.com a thenextweb.com
