Опубликовано 31 марта 2026

Holo3 устанавливает рекорд ИИ-агентов по работе за компьютером

Holo3: новый рекорд ИИ-агентов для работы за компьютером

Компания H объявила о выпуске Holo3 – модели, которая установила новый рекорд в ведущем тесте для ИИ-агентов, управляющих компьютером.

Продукты 4 – 5 минут чтения
Источник события: H Company 4 – 5 минут чтения

В то время как большинство новостей об ИИ сосредоточены на чат-ботах и генерации текста, незаметно развивается другая гонка – за ИИ-агентами, которые умеют не просто отвечать на вопросы, а работать за компьютером. Открывать приложения, нажимать кнопки, заполнять формы, выполнять задачи в реальном интерфейсе – так, как это сделал бы живой человек.

Компания H представила Holo3 – новую версию своей модели, ориентированной именно на эту задачу. И, судя по результатам тестирования, это не просто очередной релиз ради релиза.

Что такое OSWorld тест для ИИ и его роль

Что такое OSWorld и почему это важно?

Чтобы понять, почему результат Holo3 вызывает интерес, стоит сначала разобраться с тем, как вообще измеряют способность ИИ работать за компьютером.

Существует специальный тест – OSWorld-Verified. Если коротко, это набор реальных задач на обычном рабочем столе: открыть файл, найти нужную информацию, произвести действие в браузере или офисном приложении. Модель должна сама «видеть» экран и выполнять шаги – без подсказок, без специальных адаптеров, в условиях, максимально приближённых к реальной работе.

Это принципиально сложнее, чем решать задачи по математике или писать код в изолированной среде. Здесь нет чёткого «правильного ответа» – есть реальный интерфейс, который может повести себя неожиданно, и задача, которую нужно довести до конца.

Показатель 78,85% для ИИ-агентов: оценка успеха

78,85% – это много или мало?

Holo3-122B-A10B набрала 78,85% на OSWorld-Verified, установив новый рекорд среди всех известных моделей в этом тесте.

Для сравнения: несколько месяцев назад результаты лучших агентов на аналогичных задачах были значительно скромнее. Гонка здесь идёт стремительно – примерно так же, как в прошлом году ускорилась гонка языковых моделей после того, как стало ясно, что монополии на прогресс не существует.

Цифра 78,85% означает, что модель справляется почти с четырьмя задачами из пяти в условиях реального рабочего стола. Оставшиеся ~21% – это пространство, где что-то идёт не так: нестандартный интерфейс, неожиданная последовательность действий, пограничная ситуация.

Проще говоря, это уже не «демонстрационная игрушка», но ещё и не инструмент, которому можно доверить что угодно без присмотра.

Концепция «Автономное предприятие» в ИИ-разработке

«Автономное предприятие» – что это за идея?

H позиционирует Holo3 как часть концепции, которую компания называет Autonomous Enterprise«автономное предприятие».

Идея здесь вот в чём: большая часть офисной работы – это повторяющиеся действия за компьютером. Заполнить отчёт, перенести данные из одной системы в другую, проверить статус задачи, ответить на стандартный запрос. Человек тратит на это часы. ИИ-агент, умеющий работать с обычным интерфейсом, мог бы делать это сам – без специальной интеграции, без API, без того, чтобы под каждую задачу писать отдельный скрипт.

Это принципиально отличается от подхода «подключи ИИ к своей базе данных через API». Агент просто смотрит на экран и действует – как новый сотрудник, которому показали рабочий компьютер.

Развитие ниши ИИ-агентов: актуальность и тенденции

Почему сейчас, и что происходит в этой нише?

Интерес к компьютерным агентам резко вырос в последние месяцы. Это не случайно.

Во-первых, языковые модели достигли уровня, при котором они достаточно надёжно понимают инструкции и контекст – и им можно доверить выполнение многошаговых задач. Во-вторых, появились методы, позволяющие модели «видеть» экран и интерпретировать визуальный интерфейс, а не только текст.

OpenAI движется в том же направлении: GPT-5.4, выпущенная в начале марта 2026 года, была представлена именно как первая модель компании со встроенной поддержкой работы на компьютере пользователя в режиме агента. Alibaba в своём мультимодальном Qwen3.5-Omni обнаружила, что модель способна писать код, просматривая видеозапись экрана – причём эту способность не закладывали намеренно, она возникла сама.

То есть сразу несколько крупных игроков движутся к одной точке, но с разных сторон. H идёт напрямую – через специализированную модель, заточенную именно под управление рабочим столом.

Практическое применение ИИ-агентов: текущее состояние

Что это означает на практике?

Если коротко – пока ещё немного, но вектор понятен.

Результат 78,85% в тесте – это не то же самое, что «работает в реальной компании». Тест устроен аккуратно, условия воспроизводимы. Реальный офис – это другое: старые версии программ, нестандартные конфигурации, задачи, которые никто не формулировал явно.

Но такие результаты говорят о том, что технология перешла из стадии «интересный эксперимент» в стадию «это уже можно использовать в контролируемых условиях». Следующий шаг – расширение этих условий до чего-то более похожего на реальную рабочую среду.

Для разработчиков и компаний, которые следят за автоматизацией бизнес-процессов, это сигнал: агенты, умеющие работать с обычным компьютерным интерфейсом, – уже не фантастика и не далёкое будущее. Это активно развивающаяся ниша, в которой результаты меняются буквально каждые несколько недель.

Открытым остаётся вопрос надёжности: насколько такой агент справляется, когда что-то идёт не по плану? Как он реагирует на ошибку? Умеет ли остановиться и сообщить о проблеме, а не продолжать действовать в неверном направлении? Это то, что пока сложно измерить одним числом – и то, что будет определять реальную применимость подобных систем.

Ссылка на публикацию: https://hcompany.ai/holo3
Оригинальное название: Holo3
Дата публикации: 31 мар 2026
H Company hcompany.ai Французская ИИ-компания, разрабатывающая интеллектуальных агентов и модели для автоматизации сложных цифровых и бизнес-процессов.
Предыдущая статья ИИ-заводы как часть энергосети: NVIDIA и партнёры меняют подход к потреблению электричества Следующая статья LFM2.5-350M: маленькая модель с большими амбициями

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться