Опубликовано 12 февраля 2026

MolmoSpaces – открытая платформа для обучения роботов взаимодействию с реальным миром

Allen Institute for AI представил MolmoSpaces – набор инструментов для разработки ИИ, способного управлять роботами и функционировать в физическом пространстве.

Исследования 3 – 4 минуты чтения
Источник события: Ai2 3 – 4 минуты чтения

Allen Institute for AI выпустил MolmoSpaces – открытую платформу для того, что в индустрии называют embodied AI, или «воплощённым искусственным интеллектом». Проще говоря, это ИИ, который не просто генерирует текст или изображения, а способен управлять физическими устройствами: роботами, манипуляторами и дронами.

Понятие embodied AI и особенности воплощенного искусственного интеллекта

Что такое embodied AI и почему это отдельная категория

Обычные языковые модели работают в цифровом пространстве. Они обрабатывают текст, отвечают на вопросы и пишут код. Но если нужно, чтобы модель управляла роботом – скажем, подняла чашку со стола или пересекла комнату – требуется совсем другой набор навыков.

Робот должен понимать изображение с камеры, оценивать расстояние до объектов, планировать движения и корректировать их в реальном времени. Это вопрос не просто увеличения количества параметров модели, а архитектуры, данных и методов обучения.

Раньше для таких задач использовали узкоспециализированные системы: одна модель распознавала объекты, другая планировала траекторию, третья управляла моторикой. MolmoSpaces предлагает иной подход: использование мультимодальной модели, которая одновременно способна и видеть, и действовать.

Основные компоненты и возможности платформы MolmoSpaces

Что входит в MolmoSpaces

Платформа включает несколько компонентов. Во-первых, это сама модель Molmo: она уже умеет работать с изображениями и текстом, а теперь её адаптировали для управления роботами.

Во-вторых, это набор данных для обучения. Чтобы модель научилась действовать в физическом мире, нужны примеры: видео с камер роботов, записи траекторий движений и аннотации действий. Allen Institute собрал такие данные и выложил их в открытый доступ.

В-третьих, это инфраструктура для тестирования. Разработчики могут проверять свои модели в симуляторах, а затем переносить их на реальных роботов. Это снижает порог входа: не нужно сразу покупать дорогостоящее оборудование, чтобы начать эксперименты.

Преимущества открытого исходного кода для развития робототехники

Почему открытость важна именно в этой области

Воплощённый ИИ – дорогое направление. Требуются роботы, датчики и значительные вычислительные мощности. Большинство исследований проводят крупные компании, и их результаты редко публикуются полностью. Это замедляет прогресс: каждая команда вынуждена решать одни и те же базовые проблемы заново.

MolmoSpaces делает ставку на иную модель развития. Все компоненты – модель, данные и код – доступны для использования и модификации. Это позволяет исследователям и стартапам экспериментировать, не начиная работу с нуля.

Для индустрии это может означать ускорение прогресса. Если больше команд смогут работать над embodied AI, появится больше решений для складской логистики, домашней автоматизации и медицинской робототехники. Пока эти области развиваются медленно именно из-за высоких барьеров входа.

Перспективы развития MolmoSpaces и будущего воплощенного ИИ

Что дальше

Проект только запущен, и пока рано судить, насколько эффективно модель справляется со сложными задачами. Embodied AI – это не только технология, но и инженерия: даже качественная модель может давать сбои, если робот плохо откалиброван или данные собраны в условиях, отличных от реальных.

Но сам факт появления открытой платформы – уже важный шаг. До этого большинство инструментов для воплощённого ИИ были либо закрытыми, либо слишком узкоспециализированными. MolmoSpaces стремится создать экосистему, в которой разные команды могут работать над общей задачей.

Если этот подход оправдает себя, через несколько лет мы увидим роботов, которые действительно понимают окружающий мир не через жёсткие алгоритмы, а благодаря обучению на примерах. Пока это скорее база для исследований, чем готовое решение, но именно так обычно начинаются серьёзные технологические изменения.

Ссылка на публикацию: https://allenai.org/blog/molmospaces
Оригинальное название: MolmoSpaces, an open ecosystem for embodied AI
Дата публикации: 12 фев 2026
Ai2 allenai.org Американский исследовательский институт, занимающийся разработкой языковых моделей и ИИ-систем для науки и образования.
Предыдущая статья Человек в контуре: зачем ИИ для продаж нужен живой контроль Следующая статья Когда ИИ становится вашим личным покупателем: что такое агентная коммерция

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Компания AMD продемонстрировала технологию симуляции работы роботов локально на ПК с использованием собственных видеокарт – без привлечения облачных серверов и дорогостоящих вычислительных ферм.

AMDwww.amd.com 10 фев 2026

Allen Institute выпустил открытую модель HiRO-ACE для детального климатического моделирования с разрешением в километр – ранее это было доступно только на суперкомпьютерах.

Ai2allenai.org 24 янв 2026

Китайская компания выпустила открытую модель, которая работает одновременно с текстом, изображениями, видео и аудио, а также способна осуществлять поиск и анализ информации.

SenseTimewww.sensetime.com 30 янв 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться