Опубликовано 31 марта 2026

Holo3 устанавливает рекорд ИИ-агентов по работе за компьютером

Holo3: новый рекорд ИИ-агентов для работы за компьютером

Компания H объявила о выпуске Holo3 – модели, которая установила новый рекорд в ведущем тесте для ИИ-агентов, управляющих компьютером.

Продукты 4 – 5 минут чтения
Источник события: H Company 4 – 5 минут чтения

В то время как большинство новостей об ИИ сосредоточены на чат-ботах и генерации текста, незаметно развивается другая гонка – за ИИ-агентами, которые умеют не просто отвечать на вопросы, а работать за компьютером. Открывать приложения, нажимать кнопки, заполнять формы, выполнять задачи в реальном интерфейсе – так, как это сделал бы живой человек.

Компания H представила Holo3 – новую версию своей модели, ориентированной именно на эту задачу. И, судя по результатам тестирования, это не просто очередной релиз ради релиза.

Что такое OSWorld тест для ИИ и его роль

Что такое OSWorld и почему это важно?

Чтобы понять, почему результат Holo3 вызывает интерес, стоит сначала разобраться с тем, как вообще измеряют способность ИИ работать за компьютером.

Существует специальный тест – OSWorld-Verified. Если коротко, это набор реальных задач на обычном рабочем столе: открыть файл, найти нужную информацию, произвести действие в браузере или офисном приложении. Модель должна сама «видеть» экран и выполнять шаги – без подсказок, без специальных адаптеров, в условиях, максимально приближённых к реальной работе.

Это принципиально сложнее, чем решать задачи по математике или писать код в изолированной среде. Здесь нет чёткого «правильного ответа» – есть реальный интерфейс, который может повести себя неожиданно, и задача, которую нужно довести до конца.

Показатель 78,85% для ИИ-агентов: оценка успеха

78,85% – это много или мало?

Holo3-122B-A10B набрала 78,85% на OSWorld-Verified, установив новый рекорд среди всех известных моделей в этом тесте.

Для сравнения: несколько месяцев назад результаты лучших агентов на аналогичных задачах были значительно скромнее. Гонка здесь идёт стремительно – примерно так же, как в прошлом году ускорилась гонка языковых моделей после того, как стало ясно, что монополии на прогресс не существует.

Цифра 78,85% означает, что модель справляется почти с четырьмя задачами из пяти в условиях реального рабочего стола. Оставшиеся ~21% – это пространство, где что-то идёт не так: нестандартный интерфейс, неожиданная последовательность действий, пограничная ситуация.

Проще говоря, это уже не «демонстрационная игрушка», но ещё и не инструмент, которому можно доверить что угодно без присмотра.

Концепция «Автономное предприятие» в ИИ-разработке

«Автономное предприятие» – что это за идея?

H позиционирует Holo3 как часть концепции, которую компания называет Autonomous Enterprise«автономное предприятие».

Идея здесь вот в чём: большая часть офисной работы – это повторяющиеся действия за компьютером. Заполнить отчёт, перенести данные из одной системы в другую, проверить статус задачи, ответить на стандартный запрос. Человек тратит на это часы. ИИ-агент, умеющий работать с обычным интерфейсом, мог бы делать это сам – без специальной интеграции, без API, без того, чтобы под каждую задачу писать отдельный скрипт.

Это принципиально отличается от подхода «подключи ИИ к своей базе данных через API». Агент просто смотрит на экран и действует – как новый сотрудник, которому показали рабочий компьютер.

Развитие ниши ИИ-агентов: актуальность и тенденции

Почему сейчас, и что происходит в этой нише?

Интерес к компьютерным агентам резко вырос в последние месяцы. Это не случайно.

Во-первых, языковые модели достигли уровня, при котором они достаточно надёжно понимают инструкции и контекст – и им можно доверить выполнение многошаговых задач. Во-вторых, появились методы, позволяющие модели «видеть» экран и интерпретировать визуальный интерфейс, а не только текст.

OpenAI движется в том же направлении: GPT-5.4, выпущенная в начале марта 2026 года, была представлена именно как первая модель компании со встроенной поддержкой работы на компьютере пользователя в режиме агента. Alibaba в своём мультимодальном Qwen3.5-Omni обнаружила, что модель способна писать код, просматривая видеозапись экрана – причём эту способность не закладывали намеренно, она возникла сама.

То есть сразу несколько крупных игроков движутся к одной точке, но с разных сторон. H идёт напрямую – через специализированную модель, заточенную именно под управление рабочим столом.

Практическое применение ИИ-агентов: текущее состояние

Что это означает на практике?

Если коротко – пока ещё немного, но вектор понятен.

Результат 78,85% в тесте – это не то же самое, что «работает в реальной компании». Тест устроен аккуратно, условия воспроизводимы. Реальный офис – это другое: старые версии программ, нестандартные конфигурации, задачи, которые никто не формулировал явно.

Но такие результаты говорят о том, что технология перешла из стадии «интересный эксперимент» в стадию «это уже можно использовать в контролируемых условиях». Следующий шаг – расширение этих условий до чего-то более похожего на реальную рабочую среду.

Для разработчиков и компаний, которые следят за автоматизацией бизнес-процессов, это сигнал: агенты, умеющие работать с обычным компьютерным интерфейсом, – уже не фантастика и не далёкое будущее. Это активно развивающаяся ниша, в которой результаты меняются буквально каждые несколько недель.

Открытым остаётся вопрос надёжности: насколько такой агент справляется, когда что-то идёт не по плану? Как он реагирует на ошибку? Умеет ли остановиться и сообщить о проблеме, а не продолжать действовать в неверном направлении? Это то, что пока сложно измерить одним числом – и то, что будет определять реальную применимость подобных систем.

Ссылка на публикацию: https://hcompany.ai/holo3
Оригинальное название: Holo3
Дата публикации: 31 мар 2026
H Company hcompany.ai Французская ИИ-компания, разрабатывающая интеллектуальных агентов и модели для автоматизации сложных цифровых и бизнес-процессов.
Предыдущая статья ИИ-заводы как часть энергосети: NVIDIA и партнёры меняют подход к потреблению электричества Следующая статья LFM2.5-350M: маленькая модель с большими амбициями

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться