Kalifornský startup v robotice: π0.5 AI od Physical Intelligence
Společnost Physical Intelligence přináší změny do světa robotiky prostřednictvím svého nejnovějšího AI modelu nazvaného π0.5 (pí 0.5). Tento startup se zaměřuje na vývoj tzv. "foundation modelů" pro robotiku – univerzálních "mozků", které by mohly pohánět různé typy robotů v nestrukturovaných prostředích, jako jsou domácnosti či kanceláře.
Co je π0.5?
π0.5 představuje pokročilý generalistický policy model, který navazuje na předchozí verzi π0. Jde o významný krok směrem k robotům schopným efektivně operovat v rozmanitých, neuspořádaných prostředích. Na rozdíl od většiny komerčních robotů, které vyžadují přísně kontrolované prostředí (např. továrny), π0.5 je trénován pro zvládání "neuklizených" reálných prostředí, kde se objekty a uspořádání dramaticky liší.
Klíčové vlastnosti technologie
- Generalizace v otevřeném světě: Roboti poháněni π0.5 dokáží pracovat v prostředích, která nikdy předtím "neviděli" během tréninku.
- VLA architektura (Vision-Language-Action): Integruje vizuální vnímání, porozumění jazyku a generování akcí do jednoho modelu.
- Spolutrénování na heterogenních datech: Model se učí z různorodých zdrojů dat včetně obrázků, textových instrukcí a robotických akcí.
Model používá hierarchický přístup: Nejprve generuje vysokoúrovňovou akci v přirozeném jazyce. Následně ji překládá do nízkoúrovňových motorických příkazů – sekvence pohybů kloubů prováděných během přibližně jedné sekundy. Tento proces "řetězce myšlenek" umožňuje stejné neuronové síti uvažovat jak na abstraktní (sémantické) úrovni, tak na konkrétní úrovni (motorické kontroly).
V praktických testech roboti s π0.5:
- Dokázali provádět různé domácí úkoly v neznámých domácnostech.
- Přerovnávali nádobí, utírali rozlité tekutiny houbou a zvládali další běžné úkoly.
- Projevovali flexibilitu připomínající lidské řešení problémů při čelení novým výzvám.
Výkonnost modelu se stabilně zlepšuje s expozicí různorodějším tréninkovým prostředím. Po tréninku na přibližně 100 unikátních prostředích se jeho úspěšnost přibližuje modelům trénovaným přímo na testovacích scénářích.
Cíle společnosti
Physical Intelligence usiluje o vytvoření foundation modelů pro robotiku – analogických k velkým jazykovým modelům jako GPT – které by mohly sloužit jako univerzální "mozky" pro mnoho typů fyzicky ztělesněných zařízení. Jejich vize zahrnuje usnadnění programování a nasazování robotů napříč odvětvími od domácí asistence až po zdravotnictví. Ačkoliv π0.5 stále není zaměřen na vysokou zručnost nebo učení zcela nových dovedností od základů, představuje důležitý milník na cestě k vytvoření skutečně všestranných robotických asistentů, kteří jsou schopni flexibilně přizpůsobit své chování – i když čelí zcela neznámým fyzickým prostorům nebo úkolům.
Zde se můžete podívat na videa z trénování robotů.
