Představení AI modelu RoboBrain 2.0
Beijing Academy of Artificial Intelligence (BAAI) začátkem června odhalila RoboBrain 2.0, open-source AI model navržený speciálně pro zlepšení schopností humanoidních robotů v Číně. Tento model je popisován jako nejpokročilejší open-source "vtělený mozek" na světě, který má za cíl zlepšit různé typy robotů, včetně humanoidních, řešením výzev jako jsou omezené schopnosti modelů a nedostatek trénovacích dat. RoboBrain 2.0 je významný technologický pokrok v oblasti robotické inteligence a potvrzuje rostoucí ambice Číny stát se světovým lídrem v oblasti umělé inteligence a robotiky.

Funkce a účel univerzálního AI "mozku"
RoboBrain 2.0 slouží jako univerzální AI "mozek" pro roboty, umožňující vytváření chytřejších a přizpůsobivějších strojů napříč více sektory, jako je zdravotnictví, výroba a služby. Model byl navržen tak, aby poskytoval robotům pokročilé schopnosti rozhodování, adaptaci na nové situace a schopnost učení z různých prostředí. Tím, že BAAI učinila RoboBrain open-source, podporuje spolupráci mezi výzkumníky, vývojáři a průmyslovými partnery jak v Číně, tak na celém světe. Tento komunitně řízený přístup má urychlit inovace a adopci v rychle rostoucím čínském robotickém průmyslu.

Strategické partnerství a budoucí plány
Na události zahájení ředitel BAAI Wang Zhongyuan zdůraznil partnerství s více než 20 předními společnostmi a vyjádřil touhu rozšířit spolupráci dále, aby podpořil růst ve "vtělené inteligenci". Tato strategie odráží snahu Číny vybudovat rozsáhlou základnu kolem robotické technologie, kde různí hráči mohou přispívat k vývoju a zlepšování AI modelů. Open-source povaha RoboBrain je v souladu s globálními trendy směrem k transparentnosti a spolupráci ve výzkumu umělé inteligence, což potenciálně posiluje mezinárodní postavení Číny v oblasti AI a robotiky.

Výjimečné výsledky v porovnání s konkurencí
RoboBrain 2.0 dosahuje pozoruhodných výsledků v benchmarkových testech, kde jednoznačně převyšuje jak open-source, tak closed-source konkurenční modely. Ve čtyřech klíčových úlohách vtělené inteligence dosahuje RoboBrain2.0-32B nejlepších výsledků ve své kategorii, přičemž výrazně překonává modely jako GPT-4V, Claude3, LLaVA-1.5, LLaVA-OneVision-7b, Qwen2-VL-7b a RoboMamba napříč více robotickými benchmarky včetně OpenEQA, ShareRobot a RoboVQA. Zvláště působivé jsou výsledky v oblasti predikce dostupnosti (affordance prediction), kde RoboBrain překonává Qwen2-VL-7B o 14,6 AP a LLaVA-NeXT-7B o 17,3 AP na testovací sadě AGD20K, což demonstruje jeho superior schopnost porozumět fyzikálním vlastnostem objektů. V robotické manipulaci model překonává jak open-source modely jako LLAVA-OV-7B a InternVL2-8B, tak closed-source řešení, čímž potvrzuje svou pozici jako vedoucí AI model v oblasti robotiky s výjimečnými schopnostmi prostorového uvažování a plánování úloh.

