Allen Institute for AI выпустил MolmoSpaces – открытую платформу для того, что в индустрии называют embodied AI, или «воплощённым искусственным интеллектом». Проще говоря, это ИИ, который не просто генерирует текст или изображения, а способен управлять физическими устройствами: роботами, манипуляторами и дронами.
Что такое embodied AI и почему это отдельная категория
Обычные языковые модели работают в цифровом пространстве. Они обрабатывают текст, отвечают на вопросы и пишут код. Но если нужно, чтобы модель управляла роботом – скажем, подняла чашку со стола или пересекла комнату – требуется совсем другой набор навыков.
Робот должен понимать изображение с камеры, оценивать расстояние до объектов, планировать движения и корректировать их в реальном времени. Это вопрос не просто увеличения количества параметров модели, а архитектуры, данных и методов обучения.
Раньше для таких задач использовали узкоспециализированные системы: одна модель распознавала объекты, другая планировала траекторию, третья управляла моторикой. MolmoSpaces предлагает иной подход: использование мультимодальной модели, которая одновременно способна и видеть, и действовать.
Что входит в MolmoSpaces
Платформа включает несколько компонентов. Во-первых, это сама модель Molmo: она уже умеет работать с изображениями и текстом, а теперь её адаптировали для управления роботами.
Во-вторых, это набор данных для обучения. Чтобы модель научилась действовать в физическом мире, нужны примеры: видео с камер роботов, записи траекторий движений и аннотации действий. Allen Institute собрал такие данные и выложил их в открытый доступ.
В-третьих, это инфраструктура для тестирования. Разработчики могут проверять свои модели в симуляторах, а затем переносить их на реальных роботов. Это снижает порог входа: не нужно сразу покупать дорогостоящее оборудование, чтобы начать эксперименты.
Почему открытость важна именно в этой области
Воплощённый ИИ – дорогое направление. Требуются роботы, датчики и значительные вычислительные мощности. Большинство исследований проводят крупные компании, и их результаты редко публикуются полностью. Это замедляет прогресс: каждая команда вынуждена решать одни и те же базовые проблемы заново.
MolmoSpaces делает ставку на иную модель развития. Все компоненты – модель, данные и код – доступны для использования и модификации. Это позволяет исследователям и стартапам экспериментировать, не начиная работу с нуля.
Для индустрии это может означать ускорение прогресса. Если больше команд смогут работать над embodied AI, появится больше решений для складской логистики, домашней автоматизации и медицинской робототехники. Пока эти области развиваются медленно именно из-за высоких барьеров входа.
Что дальше
Проект только запущен, и пока рано судить, насколько эффективно модель справляется со сложными задачами. Embodied AI – это не только технология, но и инженерия: даже качественная модель может давать сбои, если робот плохо откалиброван или данные собраны в условиях, отличных от реальных.
Но сам факт появления открытой платформы – уже важный шаг. До этого большинство инструментов для воплощённого ИИ были либо закрытыми, либо слишком узкоспециализированными. MolmoSpaces стремится создать экосистему, в которой разные команды могут работать над общей задачей.
Если этот подход оправдает себя, через несколько лет мы увидим роботов, которые действительно понимают окружающий мир не через жёсткие алгоритмы, а благодаря обучению на примерах. Пока это скорее база для исследований, чем готовое решение, но именно так обычно начинаются серьёзные технологические изменения.