Один из самых сложных навыков для робота – не поднять предмет, а удержать и переориентировать его так, как нужно. Человек делает это не задумываясь: берёт кубик, поворачивает его в пальцах, ставит нужной стороной. Для робототехники это по-прежнему нетривиальная задача. Именно поэтому новая демонстрация от Sanctuary AI заслуживает внимания.
Команда Sanctuary AI опубликовала видео, в котором их фирменная гидравлическая рука самостоятельно манипулирует кубиком с буквами – непрерывно переориентируя его прямо в захвате. Это называется in-hand manipulation, или манипуляция «внутри руки», то есть без откладывания предмета и повторного захвата.
Ключевой момент: система работает в режиме zero-shot. Проще говоря, робот справляется с задачей без предварительного обучения именно на этом объекте. Никаких заранее записанных движений, никакой специальной разметки данных под конкретный кубик – рука адаптируется в реальном времени.
Чтобы понять масштаб задачи, достаточно представить, что происходит при повороте предмета в руке. Пальцы должны постоянно корректировать силу нажатия, отслеживать положение объекта, предсказывать, как он сдвинется при следующем движении. Всё это – в условиях неопределённости: предмет может быть скользким, угловатым, неравномерно распределённым по весу.
Гидравлика добавляет сюда отдельный уровень сложности. В отличие от электрических приводов, гидравлические системы дают больше силы и гибкости, но управлять ими точнее – труднее. Sanctuary AI давно делает ставку именно на гидравлику в своих разработках, считая её перспективной для задач, требующих тонкого физического контакта.
«Обучение без демонстраций» – это не просто красивое слово
В мире машинного обучения zero-shot (обучение без демонстраций) означает способность системы работать с новыми ситуациями, не встречавшимися ей ранее в процессе обучения. Для манипуляций с предметами это особенно ценно: в реальной среде роботу придётся иметь дело с тысячами разных объектов, и обучать его на каждом отдельно – нереалистично.
Если подход действительно работает устойчиво, это означает, что рука способна обобщать знания о физике взаимодействия с предметами – и применять их к незнакомым объектам. Это качественный сдвиг по сравнению с тем, как раньше решались задачи захвата и удержания в робототехнике.
Контекст: куда движется направление
Манипуляция предметами – одна из ключевых проблем, которую пытается решить вся индустрия гуманоидных и сервисных роботов. Пока большинство роботов умеют переносить вещи или нажимать на кнопки, точная работа руками остаётся слабым местом. Складской робот, который роняет хрупкие предметы, или манипулятор, которому нужен час настройки под новую деталь, – это не готовое решение для реального мира.
Sanctuary AI в этом контексте идёт своим путём: компания фокусируется на создании универсального рабочего тела, способного выполнять разнообразные задачи в промышленных и логистических средах. Демонстрация с кубиком – не самоцель, а иллюстрация базового навыка, без которого невозможно большинство практических применений.
Видеодемонстрация – это не то же самое, что задокументированный воспроизводимый результат. Пока неизвестно, насколько стабильно система работает на объектах разной формы, веса и текстуры поверхности. Также нет публичных данных о том, как быстро деградирует качество при переходе к более сложным предметам.
Это не значит, что результат сомнительный – просто любая демонстрация показывает лучший случай, а не среднестатистический. Насколько подход «обучения без демонстраций» масштабируется на практике – покажут следующие шаги команды.
В любом случае, направление понятно: роботы учатся держать вещи в руках так, как это делают люди. И судя по темпу, с которым выходят подобные демонстрации от разных команд, эта задача из «почти невозможных» переходит в категорию «решаемых в ближайшие годы».