Co uděláte, když vám americká vláda ze dne na den zavře přístup k nejlepším modelům na trhu? Japonská firma Sakana AI má odpověď. Jmenuje se Fugu a nesází na jeden velký model, ale na celou skupinu těch dostupných, mezi kterými si sama vybírá podle toho, co zrovna potřebuje vyřešit. Sakana tvrdí, že její vlajková verze, Fugu Ultra, drží krok s Claude Fable 5 a Mythos Preview od Anthropicu na nejnáročnějších testech v inženýrství, vědě i logice. A to aniž by tyhle zakázané modely vůbec použila.
Jen zhruba 10 dní před vydáním, donutil americký exportní příkaz Anthropic stáhnout své nejvýkonnější modely z celosvětového provozu. Celé země přišly o přístup a přesně k těmto zákazníkům mluví Sakana: nepotřebujete zakázané modely, abyste dosáhli jejich výkonu.
Princip modelu Fugu
Fugu je japonsky čtverzubec, ona ryba, kterou musí kuchaři připravovat opatrně, aby nebyla jedovatá. Samotný systém je svým způsobem taky pořádně promyšlený. Jde o jazykový model, který umí volat další modely z připravené skupiny. Dokonce i sám sebe.
Pošlete požadavek na jednu adresu a Fugu si rozhodne všechno sám. Vybere model, rozdělí úkol, ověří výsledky a poskládá z nich finální odpověď. Snadné věci vyřeší sám, u složitějších sestaví tým odborných modelů. Sahá přitom po veřejně dostupných modelech jako Gemini 3.1 Pro od Googlu, GPT-5.5 od OpenAI a Claude Opus 4.8.
Sakana nabízí dvě verze přes jediné rozhraní kompatibilní s OpenAI. Základní Fugu vyvažuje výkon a rychlost pro běžnou práci. Fugu Ultra je vyladěná na náročné úkoly jako výzkum AI, analýzu kybernetické bezpečnosti nebo prozkoumávání patentů.
Výsledky testů
Co říkají testy? Na LiveCodeBench, otevřeném měřítku pro programování, dosáhla Fugu Ultra 93,2 bodu a překonala Claude Fable 5 s 89,8. U testu GPQA-D, sady 198 vysokoškolských otázek z biologie, fyziky a chemie, zvládly obě verze Fugu 95,5 bodu a předehnaly starší Mythos Preview s 94,6. Na SWE-Bench Pro pak Fugu Ultra posbírala 73,7 bodu proti 69,2 u Opus 4.8.
Kritici upozorňují na slabinu, kterou nelze přehlédnout. Fugu může být jen tak dobrý, jak dobré jsou modely, na které dosáhne. A Fugu pořád zaostává za zakázaným Fable 5 v několika těžších úlohách.
Sakana pustila Fugu Ultra do několika praktických soubojů proti třem konkurenčním modelům, které kvůli férovosti zamaskovala jako modely A, B a C. Fugu mezi nimi vyhrávala. Sama si zlepšovala trénovací kód menšího modelu, na padesáti týdnech burzovních dat vyhnala portfolio z deseti tisíc dolarů na bezmála dvanáct, hrála šachy poslepu bez ztráty přehledu o figurách a navrhla v CADu funkční mechanickou clonu, na které konkurence pohořela.
Vzkaz zemím, které Washington odstřihl
Pro šéfa Sakany Davida Hu jsou exportní zákazy hlavním důvodem, proč Fugu vznikla. Věří, že nejsilnější systémy nebudou osamělé kolosy, ale spolupracující skupiny. „Lidská inteligence je v jádru kolektivní inteligence," napsal na síti X. Spoléhat se na model jediné firmy u národní infrastruktury je podle něj obrovský hazard, protože přístup k těm nejlepším modelům může zmizet ze dne na den. Fugu obchází omezení dodavatelů tím, že má skupinu modelů kompletně vyměnitelnou.
Proč jsou ty zakázané modely od Anthropicu vlastně tak citlivé? Fable 5 stojí na základu zvaném Mythos, který firma držela dál od veřejnosti, protože ho považovala za příliš mocný. Panovaly obavy, že by ho útočníci zneužili k napadení kritické infrastruktury nebo k výrobě biologických zbraní. Mythos prý dokázal najít slabiny v každém větším operačním systému a prohlížeči, který testoval. Fable 5 proto dostal pojistku, kdyby se ho někdo pokusil zneužít, sám se přepnul zpět do méně schopné verze Claude Opus 4.8.
Ne všichni Sakaně tleskají
Inženýr z Prime Intellect Elie Bakouch označil Fugu za uzavřený orchestrátor postavený na uzavřených modelech a tvrdí, že uživatelé teď mají pod kontrolou ještě míň než dřív. A levné to taky není, Fugu Ultra se cenou rovná GPT-5.5, tedy 35 dolarů za milion tokenů dohromady. Pod oznámením na síti X to ostatně pěkně ožilo. Jeden z nejlajkovanějších komentářů Fugu vystihl výsměšně: „Čtyři Qweny v jednom kabátě."
Tokijskou Sakanu AI založil v roce 2023 Llion Jones, jeden z autorů zásadní práce Googlu z roku 2017 s názvem „Attention Is All You Need", spolu s Davidem Hou, bývalým šéfem výzkumu ve Stability AI.
Zdroje: timesofindia.indiatimes.com a ndtv.com
