Опубликовано 12 марта 2026

MolmoBot — обучение роботов-манипуляторов на синтетических данных в симуляции

MolmoBot: робот, которого никогда не было в реальном мире, – а он уже умеет в нём работать

Исследователи из Ai2 научили робота манипулировать объектами в реальном мире, не показав ему ни одной реальной сцены в процессе обучения.

Исследования 3 – 5 минут чтения
Источник события: Ai2 3 – 5 минут чтения

Обучение роботов – дело дорогое. Не в смысле «купить железо», а в плане того, что происходит до того, как робот научится что-то делать. Нужны люди, которые управляют им вручную, снова и снова демонстрируя нужное поведение. Требуются сотни часов записей, десятки площадок, согласованная инфраструктура. Open X-Embodiment – один из крупнейших открытых наборов таких данных – собирался силами 21 организации и содержит больше миллиона реальных траекторий. DROID – ещё один известный датасет – это 350 часов телеуправления, собранных в 13 учреждениях. Это огромный труд, который остаётся главным ограничением для большинства лабораторий.

Именно поэтому идея обучить робота целиком в симуляции – без единой реальной демонстрации – выглядит одновременно привлекательно и рискованно. Привлекательно, потому что симуляция дёшева, масштабируема и воспроизводима. Рискованно, потому что реальный мир отличается от виртуального, и этот разрыв традиционно считается одним из главных препятствий.

Перенос навыков MolmoBot из виртуальной среды в реальность

Виртуальный опыт – реальный результат

Исследовательский институт Ai2 решил проверить, можно ли преодолеть этот разрыв не за счёт более реалистичной симуляции, а за счёт её разнообразия. Идея такова: если показать модели достаточно разных виртуальных сцен – различные объекты, освещение, углы камеры, текстуры, физические условия, – она научится обобщать и перенесёт этот опыт в реальность.

11 марта 2026 года Ai2 представил MolmoBot – набор моделей для управления роботами-манипуляторами, обученных исключительно на синтетических данных. Никакого реального телеуправления. Никакой доработки на реальных сценах. Только симуляция – и затем сразу реальный робот.

Результаты оказались неожиданно убедительными. На задачах типа «возьми предмет и положи его в нужное место» лучшая модель из набора превзошла π0.5 – систему от Physical Intelligence, обученную на больших объёмах реальных данных. При этом MolmoBot не видел этих объектов и сцен раньше – ни в симуляции, ни тем более в реальности.

Что умеет делать MolmoBot 🤖

Набор охватывает несколько типов задач:

  • захват объектов и их перемещение на столе;
  • работа с подвижными частями: ящиками, шкафами, микроволновками;
  • открывание дверей – с подходом, захватом ручки и движением через весь диапазон.

Управлять роботом можно словами или указанием точки – например, «возьми», «положи», «закрой». Всё это работает на двух разных платформах: стационарном манипуляторе Franka FR3 и мобильном роботе Rainbow Robotics RB-Y1.

Проще говоря, это не узкоспециализированная система под одну задачу и одного робота. Это попытка создать нечто более универсальное и сделать это открытым.

Преимущества обучения роботов без реальных демонстраций и телеуправления

Почему это важнее, чем кажется

Большинство современных систем, использующих симуляцию, применяют её как дополнение к реальным данным. Симуляция помогает, но реальные демонстрации всё равно остаются в основе. MolmoBot убирает этот слой полностью.

Для индустрии это меняет саму природу «узкого места». Сейчас главное ограничение – сбор данных: нужны люди, роботы, помещения, время. Если симуляция работает как единственный источник обучения, то критическим фактором становится уже не сбор, а проектирование виртуальных сред. А это задача, которую можно масштабировать с помощью вычислений и открытых инструментов – без армии операторов.

Для академических лабораторий это особенно важно. Многие из них просто не могут позволить себе телеоперационную инфраструктуру или партнёрство масштаба Open X-Embodiment. MolmoBot вместе с открытой экосистемой MolmoSpaces – набором инструментов для генерации синтетических данных – потенциально делает манипуляционную робототехнику доступнее.

Ограничения и перспективы использования синтетических данных в робототехнике

Честность в оценке

Важно понимать, что MolmoBot – это не заявка на окончательное решение «проблемы роботов». Это проверка гипотезы: может ли обучение только в симуляции эффективно работать для манипуляций? Ответ – по крайней мере в тех задачах, которые тестировались, – похоже, положительный.

Но открытых вопросов остаётся много. Как поведёт себя система в более сложных, хаотичных условиях? Как она справится с задачами, требующими тонкой тактильной обратной связи, которую симуляция воспроизводит неточно? Где именно она ломается и что нужно, чтобы это исправить?

Авторы сами говорят, что хотят увидеть, где модель даёт сбой. Именно для этого они открыли не только модели, но и весь технологический стек: данные, пайплайны генерации, код обучения и технический отчёт. Это нетипично для робототехники, где большинство серьёзных систем остаются закрытыми.

Если коротко: MolmoBot – это аргумент в пользу того, что синтетические данные могут стать основой, а не просто дополнением в обучении роботов. Пока это лишь один эксперимент, пусть и убедительный. Но направление, которое он задаёт, выглядит как один из наиболее реалистичных путей к тому, чтобы роботы стали доступны не только крупным корпорациям.

Ссылка на публикацию: https://allenai.org/blog/molmobot-robot-manipulation
Оригинальное название: MolmoBot: Training robot manipulation entirely in simulation
Дата публикации: 11 мар 2026
Ai2 allenai.org Американский исследовательский институт, занимающийся разработкой языковых моделей и ИИ-систем для науки и образования.
Предыдущая статья SQL как язык для «разговора» с ИИ: что предлагает связка Hologres и Model Studio Следующая статья Lightmatter вступила в отраслевой альянс XPO MSA: что это значит для ИИ-инфраструктуры

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться