Většina velkých jazykových modelů je při vlastním vývoji zcela pasivní. Inženýři píší kód, ladí parametry, hasí chyby a rozhodují, kdy je trénink dost dobrý na to, aby se zastavil. Model jen přijímá pokyny k opravě a jinak mlčí. MiniMax M2.7 tohle schéma přetváří.
Čínský startup MiniMax ze Šanghaje vydal v březnu 2026 model, o němž tvrdí, že se aktivně podílel na vlastním vývoji. Autonomní agent vestavěný do tréninkového procesu zvládal bez zásahu člověka 30 až 50 procent veškeré operativní práce, kterou by jinak odváděl zkušený ML inženýr. Ladění pracovního postupu, debugování, analýzu metrik, opravy chybných datových dávek. Tohle všechno model řešil sám. Pojďme se podívat, jak to celé funguje.
Agent, který hlídá sám sebe
Trénink velkého modelu je v praxi neustálé hašení požárů. Zkorumpovaná datová dávka způsobí výkyv v křivce chyb, paměť přeteče, manipulace s odměnami se tiše plíží systémem. Normálně přijde upozornění, probudí se inženýr, diagnostikuje problém a opraví ho. Třeba za čtyři hodiny.
Tohle u M2.7 probíhá jinak. Vedle hlavního tréninku běží samostatný agentní systém, který v reálném čase sleduje logy, detekuje anomálie a sám aplikuje opravy. Špatná datová dávka? Karantenizována automaticky. Výkyv v tréninkové křivce? Agent diagnostikuje příčinu a spustí příslušný segment znovu. Inženýr ráno dostane strukturovanou zprávu o tom, co se stalo a co bylo opraveno.
Agent se sám zlepšuje pomocí zpětné vazby učení. Dostává signály o tom, zda jeho zásahy skutečně pomohly, a podle toho upravuje své chování. Čím déle trénink běží, tím přesnější je jeho diagnostika. Meta-učení aplikované na samotné inženýrské operace.
Sto kol optimalizace bez člověka
MiniMax zkoušel nové limity. V jednom experimentu nechali M2.7 optimalizovat výkon jiného modelu v interním vývojovém prostředí zcela samostatně, přes více než 100 kol bez lidského vstupu. Každé kolo: analyzovat chyby, naplánovat změny, upravit kód, otestovat výsledky, rozhodnout, co ponechat a co zahodit. A výsledek? Třicetiprocentní zlepšení výkonu na interních testovacích sadách.
Na soutěžích strojového učení z MLE Bench Lite M2.7 dosáhl průměrné míry medailí 66,6 procenta ve třech 24hodinových taženích. To ho staví na stejnou úroveň jako Google Gemini 3.1, byť za Claud Opusem 4.6 (75,7 %) a GPT-5.4 (71,2 %) stále zaostává.
Jak si M2.7 stojí oproti špičkovým západním modelům? Na benchmarku SWE-Pro, který testuje schopnosti softwarového inženýrství, dosáhl skóre 56,22 procenta, srovnatelného s GPT-5.3-Codex. Na VIBE-Pro, benchmarku pro komplexní projektové nasazení, 55,6 procenta.
Pro firemní prostředí je zajímavý výsledek na GDPval-AA, kde M2.7 získal ELO skóre 1 495, nejvyšší mezi open-weight modely. Model zvládá víceúrovňové úpravy v dokumentech Word, Excel a PowerPoint s přesností na 97 procentech napříč více než 40 komplexními sadami instrukcí.
Výrazný je také skok v oblasti halucinací. Zatímco předchůdce M2.5 skóroval na indexu AA-Omniscience Index minus 40, M2.7 dosahuje plus jedné. Míra halucinací 34 procent je nižší než u Claude Sonnet 4.6 (46 %) nebo Gemini 3.1 Pro (50 %).
Cenově M2.7 nabízí 0,30 dolarů za milion vstupních tokenů a 1,20 dolarů za výstupní, což ho řadí mezi nejdostupnější výkonné modely na trhu.
Nejsou sami, kdo to zkouší
MiniMax není jediná firma, která experimentuje s tím, aby AI pomáhala budovat samu sebe. OpenAI u svého modelu GPT-5.3 Codex přiznalo, že rané verze modelu pomáhaly nacházet chyby při tréninku, spravovat nasazení a vyhodnocovat testovací výsledky. Tým byl prý sám překvapen, jak moc Codex urychlil vlastní vývoj.
Teoretické základy pro tohle všechno položil Jürgen Schmidhuber už v roce 2003 konceptem tzv. Gödelova stroje, který smí měnit vlastní kód jen tehdy, existuje-li formální důkaz o přínosu. Projekty jako Darwin-Gödelův stroj od Sakana AI nebo Huxley-Gödelův stroj z Schmidhuberovy laboratoře na KAUST přistupují k věci praktičtěji: AI agenti iterativně upravují vlastní kód a evolučním procesem vybírají nejlepší varianty.
M2.7 je dostupný přes MiniMax Agent a API platformu. Váhy modelu zatím veřejně k dispozici nejsou, což je pro MiniMax, dosud známý otevřeným přístupem, poměrně výrazný obrat. Firma také vydala open-source projekt OpenRoom, interaktivní grafické prostředí, kde postavy M2.7 proaktivně reagují na okolí. Malý bonus k jinak dost seriózní zprávě.
Zdroje: venturebeat.com a mindstudio.ai
