Blog /
AI /
Čínský startup MiniMax vydal model, který se trénuje sám a konkuruje GPT i Claudu

Čínský startup MiniMax vydal model, který se trénuje sám a konkuruje GPT i Claudu

Ondřej Barták
Ondřej Barták
podnikatel a programátor
25. 3. 2026
3 minut čtení
Poslechněte si článek
Audio verze článku
Čínský startup MiniMax vydal model, který se trénuje sám a konkuruje GPT i Claudu

    Většina velkých jazykových modelů je při vlastním vývoji zcela pasivní. Inženýři píší kód, ladí parametry, hasí chyby a rozhodují, kdy je trénink dost dobrý na to, aby se zastavil. Model jen přijímá pokyny k opravě a jinak mlčí. MiniMax M2.7 tohle schéma přetváří.

    Čínský startup MiniMax ze Šanghaje vydal v březnu 2026 model, o němž tvrdí, že se aktivně podílel na vlastním vývoji. Autonomní agent vestavěný do tréninkového procesu zvládal bez zásahu člověka 30 až 50 procent veškeré operativní práce, kterou by jinak odváděl zkušený ML inženýr. Ladění pracovního postupu, debugování, analýzu metrik, opravy chybných datových dávek. Tohle všechno model řešil sám. Pojďme se podívat, jak to celé funguje.

    Agent, který hlídá sám sebe

    Trénink velkého modelu je v praxi neustálé hašení požárů. Zkorumpovaná datová dávka způsobí výkyv v křivce chyb, paměť přeteče, manipulace s odměnami se tiše plíží systémem. Normálně přijde upozornění, probudí se inženýr, diagnostikuje problém a opraví ho. Třeba za čtyři hodiny.

    Tohle u M2.7 probíhá jinak. Vedle hlavního tréninku běží samostatný agentní systém, který v reálném čase sleduje logy, detekuje anomálie a sám aplikuje opravy. Špatná datová dávka? Karantenizována automaticky. Výkyv v tréninkové křivce? Agent diagnostikuje příčinu a spustí příslušný segment znovu. Inženýr ráno dostane strukturovanou zprávu o tom, co se stalo a co bylo opraveno.

    Agent se sám zlepšuje pomocí zpětné vazby učení. Dostává signály o tom, zda jeho zásahy skutečně pomohly, a podle toho upravuje své chování. Čím déle trénink běží, tím přesnější je jeho diagnostika. Meta-učení aplikované na samotné inženýrské operace.

    Sto kol optimalizace bez člověka

    MiniMax zkoušel nové limity. V jednom experimentu nechali M2.7 optimalizovat výkon jiného modelu v interním vývojovém prostředí zcela samostatně, přes více než 100 kol bez lidského vstupu. Každé kolo: analyzovat chyby, naplánovat změny, upravit kód, otestovat výsledky, rozhodnout, co ponechat a co zahodit. A výsledek? Třicetiprocentní zlepšení výkonu na interních testovacích sadách.

    Na soutěžích strojového učení z MLE Bench Lite M2.7 dosáhl průměrné míry medailí 66,6 procenta ve třech 24hodinových taženích. To ho staví na stejnou úroveň jako Google Gemini 3.1, byť za Claud Opusem 4.6 (75,7 %) a GPT-5.4 (71,2 %) stále zaostává.

    Výsledky benchmarků
    Výsledky benchmarků.

    Jak si M2.7 stojí oproti špičkovým západním modelům? Na benchmarku SWE-Pro, který testuje schopnosti softwarového inženýrství, dosáhl skóre 56,22 procenta, srovnatelného s GPT-5.3-Codex. Na VIBE-Pro, benchmarku pro komplexní projektové nasazení, 55,6 procenta.

    Pro firemní prostředí je zajímavý výsledek na GDPval-AA, kde M2.7 získal ELO skóre 1 495, nejvyšší mezi open-weight modely. Model zvládá víceúrovňové úpravy v dokumentech Word, Excel a PowerPoint s přesností na 97 procentech napříč více než 40 komplexními sadami instrukcí.

    Výrazný je také skok v oblasti halucinací. Zatímco předchůdce M2.5 skóroval na indexu AA-Omniscience Index minus 40, M2.7 dosahuje plus jedné. Míra halucinací 34 procent je nižší než u Claude Sonnet 4.6 (46 %) nebo Gemini 3.1 Pro (50 %).

    Cenově M2.7 nabízí 0,30 dolarů za milion vstupních tokenů a 1,20 dolarů za výstupní, což ho řadí mezi nejdostupnější výkonné modely na trhu.

    Nejsou sami, kdo to zkouší

    MiniMax není jediná firma, která experimentuje s tím, aby AI pomáhala budovat samu sebe. OpenAI u svého modelu GPT-5.3 Codex přiznalo, že rané verze modelu pomáhaly nacházet chyby při tréninku, spravovat nasazení a vyhodnocovat testovací výsledky. Tým byl prý sám překvapen, jak moc Codex urychlil vlastní vývoj.

    Teoretické základy pro tohle všechno položil Jürgen Schmidhuber už v roce 2003 konceptem tzv. Gödelova stroje, který smí měnit vlastní kód jen tehdy, existuje-li formální důkaz o přínosu. Projekty jako Darwin-Gödelův stroj od Sakana AI nebo Huxley-Gödelův stroj z Schmidhuberovy laboratoře na KAUST přistupují k věci praktičtěji: AI agenti iterativně upravují vlastní kód a evolučním procesem vybírají nejlepší varianty.

    M2.7 je dostupný přes MiniMax Agent a API platformu. Váhy modelu zatím veřejně k dispozici nejsou, což je pro MiniMax, dosud známý otevřeným přístupem, poměrně výrazný obrat. Firma také vydala open-source projekt OpenRoom, interaktivní grafické prostředí, kde postavy M2.7 proaktivně reagují na okolí. Malý bonus k jinak dost seriózní zprávě.

    Zdroje: venturebeat.com a mindstudio.ai

    Kategorie: AI
    Líbil se vám tento článek?
    Objevte další zajímavé příspěvky na blogu
    Zpět na blog
    Editee Dashboard

    Tvořte 10x rychleji na pár kliknutí s editee AI

    Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

    Související příspěvky

    Uvnitř laboratoře AWS, kde se rodí pokročilé čipy pro AI Uvnitř laboratoře AWS, kde se rodí pokročilé čipy pro AI
    Krátce poté, co šéf Amazonu Andy Jassy oznámil investici 50 miliard dolarů do OpenAI, přišla nečekaná nabídka. AWS (Amazon Web Services) pozvalo novin...
    5 min čtení
    25. 3. 2026
    OpenAI chce do roku 2028 vybudovat AI výzkumníka, který bude bádat bez lidské pomoci OpenAI chce do roku 2028 vybudovat AI výzkumníka, který bude bádat bez lidské pomoci
    OpenAI má nový cíl. Nebo spíše novou posedlost. Sanfranciská firma, která dala světu ChatGPT, teď soustředí všechny síly na jeden velký projekt: pln...
    4 min čtení
    25. 3. 2026
    Musk postaví dvě giga továrny na čipy pro jeho vlastní firmy Musk postaví dvě giga továrny na čipy pro jeho vlastní firmy
    Elon Musk stál na pódiu s výrazem člověka, který právě ohlásí něco, co ostatní prohlásí za šílenství. Tentokrát šlo o projekt Terafab, dva pokročilé p...
    3 min čtení
    25. 3. 2026
    Cestování

    USA

    Texas
    Podnikání Podnikání v USA
    Přihlaste se k odběru našeho newsletteru
    Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.