Baidu vyráží do boje s modely ERNIE 4.5 a X1: Čínská odpověď na GPT-4.5 za zlomek ceny
V době, kdy se zdálo, že na poli umělé inteligence diktují tempo především americké společnosti v čele s OpenAI a jejich modelem GPT-4.5, přichází čínský technologický gigant Baidu s dvojicí modelů, které mohou výrazně zamíchat kartami na globálním trhu AI. ERNIE 4.5 a ERNIE X1 nepředstavují jen další iteraci jazykových modelů – jde o strategický krok, kterým Baidu demonstruje, že dokáže nabídnout špičkovou AI technologii za zlomek ceny konkurence.
Kdo stojí za modely ERNIE: Baidu a jeho AI ambice
Baidu, často přezdívaný jako "čínský Google", byl založen v roce 2000 Robinem Li a Ericem Xu. Společnost začínala jako internetový vyhledávač, ale během dvou dekád se transformovala v technologického giganta s přesahy do mnoha oblastí. S tržní hodnotou přes 45 miliard dolarů patří mezi nejvýznamnější čínské technologické firmy. V posledních letech Baidu významně investuje do umělé inteligence – od autonomního řízení (projekt Apollo) až po cloudové služby a právě jazykové modely. Řada ERNIE (Enhanced Representation through kNowledge IntEgration) představuje vlajkovou loď těchto snah. Zatímco západní svět zná především ChatGPT či Claudea, v Číně dominuje právě ERNIE Bot, který nyní dostal dvě výrazné aktualizace. "Naším cílem je demokratizovat přístup k pokročilé umělé inteligenci a poskytnout ji co nejširšímu okruhu uživatelů," uvedl Robin Li, CEO Baidu, při představení nových modelů. "Věříme, že AI by neměla být luxusním zbožím, ale nástrojem dostupným pro každého."
ERNIE 4.5: Multimodální model s výkonem GPT-4.5 za 1 % ceny
ERNIE 4.5 představuje skutečný průlom v poměru cena/výkon. Jde o pokročilý multimodální model, který nativně pracuje s textem, obrázky, zvukem i videem. Dokáže interpretovat složité obsahy včetně internetových memů, satirických kreslených vtipů nebo jemných jazykových nuancí – oblasti, kde mnohé modely stále tápou. Co je však nejpozoruhodnější, ERNIE 4.5 podle benchmarků překonává GPT-4.5 na mnoha úlohách, a to za pouhé 1 % jeho ceny. Zatímco za použití GPT-4.5 zaplatíte přibližně $10 za milion tokenů na výstupu, u ERNIE 4.5 se bavíme o částce kolem $0.10.

"Když jsme poprvé viděli cenovou politiku, mysleli jsme, že jde o překlep," komentuje situaci Jan Novák, analytik specializující se na trh AI. "Baidu efektivně zahajuje cenovou válku, kterou západní společnosti budou těžko ignorovat." Technicky model těží z několika inovací, které Baidu vyvinulo specificky pro ERNIE 4.5:
- FlashMask – systém dynamického maskování pozornosti, který dramaticky zvyšuje efektivitu zpracování dlouhých sekvencí dat.
- Heterogenní multimodální architektura mixture-of-experts – umožňuje lepší integraci různých typů dat (text, obraz, zvuk).
- Komprese časoprostorové reprezentace – technologie zefektivňující práci s videem a zvukem.
Praktické využití sahá od analýzy dokumentů (DOC/PDF/PPT/Excel) přes řešení matematických problémů z obrázků s podrobným vysvětlením až po generování obrázků podle textových popisů.
ERNIE X1: Specializovaný model pro hluboké uvažování
Zatímco ERNIE 4.5 je všestranný model pro široké spektrum úloh, ERNIE X1 představuje specializovanou verzi zaměřenou na hluboké uvažování a řešení složitých problémů. Model vyniká v pokročilých logických úlohách, matematice a komplexním kódování. "ERNIE X1 jsme navrhli pro uživatele, kteří potřebují více než jen generování textu – potřebují partnera pro skutečné přemýšlení," vysvětluje Haifeng Wang, technický ředitel Baidu. "Model dokáže rozložit složité problémy na kroky, vysvětlit svou logiku a využívat různé nástroje k dosažení výsledku." Model integruje celou řadu nástrojů: vyhledávač, schopnost dotazovat se dokumentů, porozumění a generování obrázků, čtení webových stránek, tvorbu myšlenkových map a další. Co je pozoruhodné – model dokáže transparentně vysvětlit svůj myšlenkový postup, což je cenná vlastnost zejména v obchodních, výzkumných či právních kontextech.
Cena a dostupnost
Cenově ERNIE X1 konkuruje modelu DeepSeek-R1, ale za poloviční cenu. Vstupní ceny začínají na pouhých 0,002 RMB za tisíc tokenů (přibližně $0.28 za milion tokenů), což představuje agresi, jakou trh AI dosud nezažil. Baidu svou cenovou politikou fundamentálně mění pravidla hry. Oba modely jsou zdarma pro jednotlivce prostřednictvím platformy ERNIE Bot, zatímco pro firemní využití jsou ceny drasticky nižší než u západní konkurence. "Je to jako kdyby někdo začal prodávat luxusní automobily za cenu ojetiny," přirovnává situaci Pavel Horák, konzultant pro implementaci AI v podnicích. "Modely jako GPT-4.5 byly pro mnohé malé a střední podniky finančně nedostupné. ERNIE tuto bariéru efektivně odstraňuje."
Strategie Baidu je zřejmá – rychle rozšířit uživatelskou základnu a získat významný podíl na globálním trhu AI. Přestože oba modely mají zatím omezenou dostupnost mimo Čínu (především kvůli jazykovým a účetním omezením), představují významnou výzvu dominanci západních modelů. Navíc, podle dostupných informací, Baidu plánuje tyto modely v polovině roku open-sourcovat, což by mohlo ještě více zpřístupnit přístup k pokročilé AI technologii.
Další plány do budoucna?
Navzdory působivým specifikacím a revoluční cenové politice, modely ERNIE čelí několika výzvám. První je jazyková bariéra – přestože modely podporují angličtinu, jejich primární vývoj probíhal s důrazem na čínštinu. To může ovlivnit kvalitu výstupu v jiných jazycích, včetně češtiny. Druhou výzvou je geopolitická situace – rostoucí napětí mezi Čínou a západními zeměmi může komplikovat širší adopci těchto modelů mimo asijský region. Navíc existují obavy ohledně zabezpečení dat a potenciálního přístupu čínských úřadů k informacím zpracovávaným těmito modely. "Technologicky jde o působivé produkty, ale firmy si musí položit otázku, zda jsou připravené svěřit svá data čínské společnosti," upozorňuje Markéta Nováková, expertka na kybernetickou bezpečnost. "Zejména pro evropské a americké firmy to může představovat regulatorní výzvu."
Budoucí konkurenční boj
Modely ERNIE 4.5 a ERNIE X1 od Baidu a kombinace špičkového výkonu a bezprecedentně nízké ceny může katalyzovat mnohem širší adopci AI technologií napříč různými sektory a geografickými regiony. Pro OpenAI, Anthropic a další západní společnosti to představuje výzvu, na kterou budou muset reagovat – buď snížením cen, nebo nabídnutím funkcí a kvalitou služeb, které ospravedlní cenový rozdíl. Jedno je jisté – éra, kdy pokročilá AI byla luxusem dostupným pouze pro velké korporace s hlubokými kapsami, se rychle chýlí ke konci. A Baidu je jedním z hlavních architektů této změny.
