1. února přišla na trh bomba jménem MiniMax M2.5. Zatímco giganti jako OpenAI a Anthropic válčí o to, kdo má chytřejší model, MiniMax změnila pravidla hry. Jejich nový model totiž není jen výkonný – je taky směšně levný. Jak levný? Za dolar běží nepřetržitě celou hodinu při rychlosti 100 tokenů za sekundu. To je jako byste si najali programátora, který pracuje 24/7 a stojí vás méně než káva.
Když AI píše kód rychleji než lidé
M2.5 dosáhl něčeho, o čem ostatní modely můžou jen snít. V benchmarku SWE-Bench Verified nasbíral 80,2 % úspěšnost. Co to znamená v praxi? Model dokáže opravovat reálné bugy v kódu, navrhovat architekturu celých systémů a psát aplikace od nuly. A to ne jen v Pythonu – zvládá přes 10 programovacích jazyků včetně Go, Rust, TypeScript nebo Kotlinu.
Jenže tady přichází ten šílený zvrat. MiniMax trénoval svůj model v 200 tisících reálných prostředích. Ne v simulacích, ne na syntetických datech. V opravdových projektech. Model se učil psát kód jako senior vývojář – nejdřív rozloží problém, navrhne architekturu, pak teprve začne programovat.
Rychlost, která vás dostane
Rychlost M2.5 je brutální. Dokončí úkoly v benchmarku SWE-Bench o 37 % rychleji než jeho předchůdce M2.1. Vyrovná se Claude Opus 4.6, ale stojí jen desetinu jeho ceny. Představte si, že máte čtyři instance tohoto modelu běžící celý rok non-stop. Kolik vás to vyjde? Deset tisíc dolarů. Celý rok. Čtyři AI agenti pracující bez přestávky.
Proč je to tak levné? MiniMax postavil celou infrastrukturu na efektivitě. Model běží nativně na 100 tokenech za sekundu – dvojnásobek toho, co nabízí konkurence. Zároveň ho naučili myslet ekonomicky. Neřeší problémy hrubou silou, ale chytře. Používá méně kroků, méně tokenů, přesto dosahuje lepších výsledků.
V čem MiniMax M2.5 opravdu září?
- Kancelářská práce? Žádný problém
Abychom to pochopili správně, musíme se podívat, jak MiniMax trénoval svůj model pro kancelářskou práci. Nespoléhali se jen na data z internetu. Přizvali seniory z finančnictví, práva a sociálních věd. Ti navrhovali úkoly, hodnotili výstupy a učili model, jak se dělá opravdová práce v Excelu, Wordu nebo PowerPointu.
Výsledek? M2.5 dokáže vytvořit finanční model podle specifických standardů vaší firmy. Napíše vám výzkumnou zprávu s perfektním formátováním. Sestaví prezentaci, která vypadá, jako by ji dělal člověk s deseti lety praxe. V interním benchmarku GDPval-MM dosáhl průměrné úspěšnosti 59 % proti ostatním modelům. - Když AI hledá jako profesionál
Vyhledávání na internetu zní jednoduše, že? Jenže zkuste najít odpověď na složitou odbornou otázku. Musíte procházet desítky stránek, filtrovat informace, ověřovat zdroje. M2.5 to dělá jako expert. V benchmarku BrowseComp dosáhl 76,3 % s kontextovým managementem. To znamená, že dokáže procházet složité weby, extrahovat relevantní data a poskládat z nich smysluplnou odpověď.
A tady je další finta – model se naučil být efektivní. Zatímco jeho předchůdce M2.1 potřeboval víc kroků k vyřešení úkolu, M2.5 to zvládne s o 20 % méně kroky. Nepátrá naslepo. Ví, co hledá, a jde přímo k cíli. - MiniMax Agent: AI jako kolega
Firma MiniMax nasadila M2.5 do svého produktu MiniMax Agenty. A tady to začíná být opravdu zajímavé. Uživatelé si můžou vytvářet vlastní "Experty" – specializované AI asistenty pro konkrétní úkoly. Chcete AI, která vám dělá průzkum trhu podle vašeho firemního frameworku? Žádný problém. Potřebujete asistenta, který vytváří finanční modely podle vašich standardů? Hotovo.
Doteď uživatelé vytvořili přes 10 tisíc těchto Expertů. A číslo raketově roste. Sám MiniMax používá svůj model interně – 30 % všech úkolů ve firmě dělá AI. V programování je to ještě šílenější: 80 % nově napsaného kódu pochází z M2.5.
Závod s časem
Za poslední tři a půl měsíce MiniMax vypustil tři modely: M2, M2.1 a teď M2.5. Tempo zlepšování je rychlejší než u konkurence jako je Claude, GPT nebo Gemini. V benchmarku SWE-Bench Verified rostou rychleji než kdokoliv jiný.
Co za tím stojí? Reinforcement learning na steroidech. MiniMax vytvořil stovky tisíc tréninkových prostředí z reálných úkolů, které dělají ve firmě. Postavili vlastní framework jménem Forge, který dokáže trénovat model na různých agentech a nástrojích současně. Výsledek? Zrychlení tréninku o 40x.
Jsme svědky něčeho velkého. AI přestává být luxusní hračkou pro velké firmy. Když model stojí dolar za hodinu provozu, může si ho dovolit kdokoliv. Malé startupy. Freelanceři. Studenti. Kdokoliv, kdo potřebuje inteligentního asistenta, který neusne, nestěžuje si a pracuje za pár korun.
