Google DeepMind направи нова крачка в развитието на автономни роботи с представянето на Gemini Robotics On-Device - изкуствен интелект от тип "зрение - език - действие" (VLA), който може да изпълнява сложни физически задачи без нужда от постоянна интернет връзка. Това е олекотена и компактна версия на представения по-рано модел Gemini Robotics, която вече работи изцяло на устройството, като осигурява сходен обхват от възможности.

Новият AI е способен да интерпретира гласови команди, да се ориентира в реално време и да извършва прецизни действия - от преместване на предмети до връзване на обувки. По думите на Каролина Парада, ръководител на роботиката в Google DeepMind, този тип изкуствен интелект се адаптира към нови сценарии с минимално обучение - само 50 до 100 демонстрации в симулатора MuJoCo са достатъчни.

Първоначално разработен за роботите Google ALOHA, моделът вече работи успешно и с хуманоидния Apollo на Apptronik, както и с двуръкия Franka FR3. Последният е изпълнил задачи, свързани със сглобяване на индустриално оборудване - без да е бил предварително обучаван за тях.

Google предоставя на разработчиците и SDK инструмент за тестване и настройка на Gemini Robotics On-Device. Това е първата такава стъпка в отварянето на VLA-моделите на DeepMind за по-широка употреба. Решението е особено ценно за компании, които се нуждаят от автономни роботи с високо ниво на сигурност и без нужда от постоянен интернет достъп.