Blog /
AI /
Škálování AI není vše. Nvidia a univerzita v Hong Kongu představili model silnjěší než konkurence.

Škálování AI není vše. Nvidia a univerzita v Hong Kongu představili model silnjěší než konkurence.

Ondřej Barták
Ondřej Barták
podnikatel a programátor
2. 12. 2025
1 minut čtení
Škálování AI není vše. Nvidia a univerzita v Hong Kongu představili model silnjěší než konkurence.

Představte si malý model s 8 miliardami parametrů, který se jmenuje Orchestrator a funguje jako dirigent v orchestru plném nástrojů a chytrých modelů. Tento kousek od výzkumníků od Nvidie a University of Hong Kong řeší složité úlohy, jako ty z Humanity's Last Exam (HLE), kde dosáhl skóre 37,1 %, zatímco GPT-5 jen 35,1 %. A to všechno při 2,5násobné úspoře nákladů! Žádný obří model, jen chytrá koordinace.

Proč jsou malé modely výkonější než velké?

Orchestrator není žádný osamělý hrdina – volá si na pomoc nástroje jako Tavily search API pro webové vyhledávání, Python sandbox pro spouštění kódu nebo specializované modely jako Qwen2.5-Math-72B pro matematiku. V tréninku používá posilování učení s odměnami za správný výsledek, nízké náklady a dodržení uživatelských preferencí. Například na benchmarku FRAMES překonal GPT-5 s 76,3 % úspěšností při pouhých 30 % nákladů.

Výsledky benchamrků a cena
Výsledky benchamrků a cena

V každém kole Orchestrator přemýšlí, vybere nástroj – třeba GPT-5-mini pro kódování nebo Llama-3.3-70B-Instruct pro obecnější úkoly – a pak zpracuje odpověď. Výzkumníci vytvořili dataset ToolScale s tisíci příklady z oblastí jako finance, sport nebo medicína, kde model učí koordinovat až 50 kol interakcí. Výsledek? Na τ²-Bench dosáhl 80,2 %, přičemž volal GPT-5 jen ve 40 % případů, a přesto byl lepší než samotný GPT-5.

Přizpůsobení pro každého

Uživatelé si mohou nastavit preference – například upřednostnit lokální vyhledávání před internetovým kvůli soukromí. Orchestrator se tomu přizpůsobí, což ho dělá flexibilním i pro neznámé nástroje jako Claude Opus 4.1 nebo DeepSeekMath-7b-Instruct. Celý systém je navržený tak, aby byl rychlý a levný s latencí v minutách a náklady v centech. Podrobnou zprávu si můžete přečíst na arxiv.org.

Kategorie: AI

Komentáře

0

Chcete se zapojit do diskuze?

Buďte ve spojení s komunitou a získejte přístup k exkluzivnímu obsahu.

Zatím žádné komentáře. Buďte první!

Líbil se vám tento článek?
Objevte další zajímavé příspěvky na blogu
Zpět na blog
Editee Dashboard

Tvořte 10x rychleji na pár kliknutí s editee AI

Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

Související příspěvky

GPT-5.6 je venku, ale na přístup k jeho třem novým verzím si zatím musíme počkat GPT-5.6 je venku, ale na přístup k jeho třem novým verzím si zatím musíme počkat
OpenAI odhalilo novou generaci svých modelů, GPT-5.6. Jde o trojici modelů s názvy Sol, Terra a Luna. Každý míří na jinou kombinaci výkonu a ceny. Má...
5 min čtení
29. 6. 2026
Chyby v Google AI Overviews, kterých jsou miliony a trvají už dva roky Chyby v Google AI Overviews, kterých jsou miliony a trvají už dva roky
V květnu 2024 zapnul Google funkci, která od základu změnila, jak vypadá výsledek vyhledávání. AI Overviews, tedy shrnutí psaná umělou inteligencí, se...
5 min čtení
26. 6. 2026
Dokument Evropa 2031: děsivá vize AI budoucnosti, kterou si v Bruselu předávají z ruky do ruky Dokument Evropa 2031: děsivá vize AI budoucnosti, kterou si v Bruselu předávají z ruky do ruky
Je rok 2031 a Evropa stojí před třemi mizernými možnostmi. Stát se americkým protektorátem. Předat budoucnost Číně. Nebo pomalu vyschnout v izolaci. J...
8 min čtení
26. 6. 2026
Cestování

USA

Texas
Podnikání Podnikání v USA
Přihlaste se k odběru našeho newsletteru
Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.