Blog /
Gemini Robotics 1.5: Nová generace robotů, kteří myslí a jednají

Gemini Robotics 1.5: Nová generace robotů, kteří myslí a jednají

Ondřej Barták
Ondřej Barták
podnikatel a programátor
29. 9. 2025
3 minut čtení
Gemini Robotics 1.5: Nová generace robotů, kteří myslí a jednají

Gemini Robotics 1.5: Nová generace robotů, kteří myslí a jednají

Představte si robota, který nejen vidí svět kolem sebe, ale i plánuje, co udělá dál, a vysvětluje své rozhodnutí slovy. Právě to umožňuje nový model Gemini Robotics 1.5 od Google DeepMind, který vyšel 25. září 2025. Tento model vidění-jazyk-akce (VLA) bere vizuální informace a slovní pokyny a převádí je přímo na pohyby robota. Například, když robot dostane úkol roztřídit prádlo podle barev, nejdřív si to promyslí – bílé do bílého koše, barevné do černého – a pak teprve začne pohybovat rukama, aby to provedl. To všechno díky schopnosti modelu generovat vnitřní řetězec myšlenek v přirozeném jazyce, což dělá celý proces průhlednější.

Model spolupracuje s dalším, nazvaným Gemini Robotics-ER 1.5, který funguje jako mozek na vyšší úrovni. Tento model vidění-jazyk (VLM) se specializuje na plánování a logické rozhodování v reálném prostředí. Dokáže volat digitální nástroje, jako je Google Search, aby získal potřebné informace – třeba místní pravidla pro třídění odpadu. Potom pošle přesné instrukce modelu Gemini Robotics 1.5, který je promění v konkrétní akce. Oba modely jsou postavené na základě rodiny modelů Gemini a vyladěné na specifických datech, což jim umožňuje zvládat delší úkoly v různých prostředích.

Myšlení před každým pohybem

Jedna z největších výhod Gemini Robotics 1.5 spočívá v tom, že robot přemýšlí, než se pohne. Při úkolu jako "roztřiď moje prádlo podle barev" model nejdřív analyzuje situaci: chápe, že bílé patří do jednoho koše a barevné do druhého. Pak si naplánuje pohyby, například vzít červený svetr a položit ho do černého koše, a dokonce zváží detaily, jako posunout svetr blíž pro snazší uchopení. Tento proces dělí složité úkoly na jednodušší části, což pomáhá robotovi zvládat nové situace a být odolnější vůči změnám v okolí.

Přemýšlení před akcí

Díky této schopnosti se robot stává flexibilnějším. Například při třídění objektů do kompostu, recyklace a odpadu nejdřív zjistí místní pravidla přes internet, prohlédne předměty před sebou a pak je roztřídí. To všechno bez nutnosti přesných příkazů od člověka – stačí obecný požadavek.

Učení přes různé typy robotů

Gemini Robotics 1.5 dokáže přenášet naučené dovednosti mezi různými roboty, což je obrovský pokrok. Pokud se model naučí úkol na robotu ALOHA 2 s dvěma rameny, stejný pohyb funguje i na humanoidním robotu Apollo od firmy Apptronik nebo na bi-arm robotu Franka. To znamená, že není potřeba model upravovat pro každý nový typ robota – dovednosti se přenáší přímo, což urychluje učení a dělá roboty univerzálnějšími.

Tento přístup vychází z tréninku na datech z různých robotů, což umožňuje generalizaci. Například úkoly trénované jen na ALOHA 2 fungují okamžitě na Apollu nebo Frankovi, a naopak.

Bezpečnost a dostupnost pro vývojáře

Bezpečnost je klíčová, a proto model Gemini Robotics 1.5 zahrnuje myšlení o bezpečnosti před každou akcí, respektování dialogu s lidmi podle zásad Gemini a aktivaci systémů proti kolizím na robotovi. Google DeepMind vylepšil benchmark ASIMOV pro hodnocení bezpečnosti, který teď zahrnuje lepší pokrytí okrajových případů, anotace a nové typy otázek i videí. Model Gemini Robotics-ER 1.5 dosáhl v těchto testech špičkových výsledků.

Od 25. září 2025 je Gemini Robotics-ER 1.5 dostupný pro vývojáře přes Gemini API v Google AI Studio. Plná verze Gemini Robotics 1.5 je zatím pro vybrané partnery. Podrobnosti o stavbě s těmito modely najdete na blogu pro vývojáře.

Tento vývoj přináší roboty blíž k tomu, aby pomáhali v každodenním životě – od úklidu po složité úkoly v průmyslu. S Gemini Robotics 1.5 se umělá inteligence stává součástí fyzického světa, kde roboti nejen reagují, ale i aktivně přemýšlejí a plánují.

Kategorie: Robotika

Komentáře

0

Chcete se zapojit do diskuze?

Buďte ve spojení s komunitou a získejte přístup k exkluzivnímu obsahu.

Zatím žádné komentáře. Buďte první!

Líbil se vám tento článek?
Objevte další zajímavé příspěvky na blogu
Zpět na blog
Editee Dashboard

Tvořte 10x rychleji na pár kliknutí s editee AI

Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

Související příspěvky

Roboti firmy Figure AI sami odpracovali celou 8hodinovou směnu na lince Roboti firmy Figure AI sami odpracovali celou 8hodinovou směnu na lince
Americká robotická firma Figure AI odvysílala živý přenos, který sledovaly miliony lidí po celém světě. Na obrazovce byli roboti, kteří třídili balí...
5 min čtení
15. 5. 2026
Genesis AI představila robotické ruce s prsty schopnými skutečné lidské manipulace Genesis AI představila robotické ruce s prsty schopnými skutečné lidské manipulace
Pařížský startup Genesis AI minulý týden odhalil něco, po čem robotici touží desetiletí. Stroj, který pohybuje prsty jako skutečný člověk. Firma př...
4 min čtení
11. 5. 2026
Tvůrce robotických vysavačů přichází s AI robotickým mazlíčkem, se kterým se budete chtít mazlit Tvůrce robotických vysavačů přichází s AI robotickým mazlíčkem, se kterým se budete chtít mazlit
Muž, který světu dal robotický vysavač Roomba, přichází s novým nápadem. Colin Angle odhalil čtyřnohého robotického mazlíčka jménem Familiar a chce,...
4 min čtení
7. 5. 2026
Cestování

USA

Texas
Podnikání Podnikání v USA
Přihlaste se k odběru našeho newsletteru
Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.