Опубликовано 12 февраля 2026

MolmoSpaces – открытая платформа для обучения роботов взаимодействию с реальным миром

Allen Institute for AI представил MolmoSpaces – набор инструментов для разработки ИИ, способного управлять роботами и функционировать в физическом пространстве.

Исследования 3 – 4 минуты чтения
Источник события: Ai2 3 – 4 минуты чтения

Allen Institute for AI выпустил MolmoSpaces – открытую платформу для того, что в индустрии называют embodied AI, или «воплощённым искусственным интеллектом». Проще говоря, это ИИ, который не просто генерирует текст или изображения, а способен управлять физическими устройствами: роботами, манипуляторами и дронами.

Понятие embodied AI и особенности воплощенного искусственного интеллекта

Что такое embodied AI и почему это отдельная категория

Обычные языковые модели работают в цифровом пространстве. Они обрабатывают текст, отвечают на вопросы и пишут код. Но если нужно, чтобы модель управляла роботом – скажем, подняла чашку со стола или пересекла комнату – требуется совсем другой набор навыков.

Робот должен понимать изображение с камеры, оценивать расстояние до объектов, планировать движения и корректировать их в реальном времени. Это вопрос не просто увеличения количества параметров модели, а архитектуры, данных и методов обучения.

Раньше для таких задач использовали узкоспециализированные системы: одна модель распознавала объекты, другая планировала траекторию, третья управляла моторикой. MolmoSpaces предлагает иной подход: использование мультимодальной модели, которая одновременно способна и видеть, и действовать.

Основные компоненты и возможности платформы MolmoSpaces

Что входит в MolmoSpaces

Платформа включает несколько компонентов. Во-первых, это сама модель Molmo: она уже умеет работать с изображениями и текстом, а теперь её адаптировали для управления роботами.

Во-вторых, это набор данных для обучения. Чтобы модель научилась действовать в физическом мире, нужны примеры: видео с камер роботов, записи траекторий движений и аннотации действий. Allen Institute собрал такие данные и выложил их в открытый доступ.

В-третьих, это инфраструктура для тестирования. Разработчики могут проверять свои модели в симуляторах, а затем переносить их на реальных роботов. Это снижает порог входа: не нужно сразу покупать дорогостоящее оборудование, чтобы начать эксперименты.

Преимущества открытого исходного кода для развития робототехники

Почему открытость важна именно в этой области

Воплощённый ИИ – дорогое направление. Требуются роботы, датчики и значительные вычислительные мощности. Большинство исследований проводят крупные компании, и их результаты редко публикуются полностью. Это замедляет прогресс: каждая команда вынуждена решать одни и те же базовые проблемы заново.

MolmoSpaces делает ставку на иную модель развития. Все компоненты – модель, данные и код – доступны для использования и модификации. Это позволяет исследователям и стартапам экспериментировать, не начиная работу с нуля.

Для индустрии это может означать ускорение прогресса. Если больше команд смогут работать над embodied AI, появится больше решений для складской логистики, домашней автоматизации и медицинской робототехники. Пока эти области развиваются медленно именно из-за высоких барьеров входа.

Перспективы развития MolmoSpaces и будущего воплощенного ИИ

Что дальше

Проект только запущен, и пока рано судить, насколько эффективно модель справляется со сложными задачами. Embodied AI – это не только технология, но и инженерия: даже качественная модель может давать сбои, если робот плохо откалиброван или данные собраны в условиях, отличных от реальных.

Но сам факт появления открытой платформы – уже важный шаг. До этого большинство инструментов для воплощённого ИИ были либо закрытыми, либо слишком узкоспециализированными. MolmoSpaces стремится создать экосистему, в которой разные команды могут работать над общей задачей.

Если этот подход оправдает себя, через несколько лет мы увидим роботов, которые действительно понимают окружающий мир не через жёсткие алгоритмы, а благодаря обучению на примерах. Пока это скорее база для исследований, чем готовое решение, но именно так обычно начинаются серьёзные технологические изменения.

Ссылка на публикацию: https://allenai.org/blog/molmospaces
Оригинальное название: MolmoSpaces, an open ecosystem for embodied AI
Дата публикации: 12 фев 2026
Ai2 allenai.org Американский исследовательский институт, занимающийся разработкой языковых моделей и ИИ-систем для науки и образования.
Предыдущая статья Человек в контуре: зачем ИИ для продаж нужен живой контроль Следующая статья Когда ИИ становится вашим личным покупателем: что такое агентная коммерция

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Компания AMD продемонстрировала технологию симуляции работы роботов локально на ПК с использованием собственных видеокарт – без привлечения облачных серверов и дорогостоящих вычислительных ферм.

AMDwww.amd.com 10 фев 2026

Allen Institute выпустил открытую модель HiRO-ACE для детального климатического моделирования с разрешением в километр – ранее это было доступно только на суперкомпьютерах.

Ai2allenai.org 24 янв 2026

Китайская компания выпустила открытую модель, которая работает одновременно с текстом, изображениями, видео и аудио, а также способна осуществлять поиск и анализ информации.

SenseTimewww.sensetime.com 30 янв 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться