Microsoft představil CLIO: Kontrolní nástavbu, která dokáže vylepšit jakoukoliv AI
Společnost Microsoft Research nedávno představila novinku, se kterou má být umělá inteligence přesnější a užitečnější pro nové výzkumy a objevy. Je jí kontrolní nástavba s názvem CLIO, která dokáže z klasických jazykových modelů udělat chytřejší, „přemýšlející“ AI. A to všechno bez jakéhokoliv tréninku!
Práce s umělou inteligencí vypadala doposud nějak takto – jazykový model (např. GPT-4) se jednou vytrénoval, a tím to skončilo. Při kladení dotazů pak poskytoval odpovědi, ale jeho trénink dál nepokračoval a do způsobu jeho uvažování nešlo nijak zasahovat. Tohle má ale CLIO změnit.
Co přesně CLIO dělá
Umělá inteligence představuje velký potenciál ve vědě a výzkumu. Vědci a odborníci však často narážejí na problém, že se AI na otázky dívá ve svých zajetých kolejích, a není schopna reagovat na podněty a měnit svůj způsob uvažování. CLIO to ale zvládne. Umí totiž z klasického AI modelu udělat vědeckého asistenta, který dokáže kriticky pohlédnout na své myšlení a upravit ho přímo za chodu během řešení úlohy.
Zkratka CLIO vychází z názvu Cognitive Loop via In-Situ Optimalization a právě tyto kognitivní smyčky umožňují AI nástavbě přemýšlet, hodnotit a měnit strategie.

Lepší výsledky bez dalšího učení
Když klasický jazykový model dostane dotaz, odpoví na něj podle toho, jak byl natrénován. Do jeho myšlenkových pochodů nevidíme, a tak nedokážeme říct, jak k odpovědi dospěl a zda se někde nespletl.
CLIO však bez dalšího tréninku udělá z AI virtuálního vědeckého kolegu, který se zastaví, když něco neví a přizná, že se ztratil. Odborníci tak mají možnost umělou inteligenci lépe nasměrovat a více se tak spolehnout na konečné výsledky. Kromě toho mohou přímo vidět, jak model přemýšlí, a v kterých momentech si není jistý.
Vylepšení GPT-4.1
A teď se podívejme, jak si CLIO vede v praxi. Jedním z nejtěžších benchmarků (srovnávacích testů pro AI) je takzvaný Humanity’s Last Exam. Tento test se skládá z 2500 otázek z nejrůznějších oblastí. Jeho náročnost spočívá v tom, že odpovědi na otázky se nedají jednoduše vyhledat. Jedná se o komplexní úlohy a je třeba postupovat vícekrokově a slučovat rozmanité znalosti.
Na náročných otázkách z biologie a medicíny dokázal CLIO zvýšit přesnost modelu GPT-4.1 z 8,55 % na 22,37 %. Kontrolní mechanismus přidaný ke klasickému jazykovému modelu tak výsledky vylepšil o 161 % a dokonce překonal i „reasoning“ model o3, který se pyšní znalostmi Ph.D. studenta.

CLIO jako partner pro nové výzkumy a objevy
CLIO od Microsoft Research není nový jazykový model, ale způsob, jak s modelem pracovat. Chová se jako kontrolní mechanismus, který AI nutí své odpovědi kontrolovat, vyhodnocovat míru jistoty a případně je měnit. Přináší proto výsledky, které jsou přesnější, transparentnější a člověk do nich může průběžně zasahovat.
V současnosti se CLIO využívá především pro vědecký výzkum (např. zdravotnictví). V budoucnu by však mohl najít širší využití v oborech jako finance, právo nebo inženýrství, kde transparentnost rozhodnutí hraje klíčovou roli.
