Опубликовано 31 марта 2026

Holo3 устанавливает рекорд ИИ-агентов по работе за компьютером

Holo3: новый рекорд ИИ-агентов для работы за компьютером

Компания H объявила о выпуске Holo3 – модели, которая установила новый рекорд в ведущем тесте для ИИ-агентов, управляющих компьютером.

Продукты 4 – 5 минут чтения

Источник события: H Company 4 – 5 минут чтения

В то время как большинство новостей об ИИ сосредоточены на чат-ботах и генерации текста, незаметно развивается другая гонка – за ИИ-агентами, которые умеют не просто отвечать на вопросы, а работать за компьютером. Открывать приложения, нажимать кнопки, заполнять формы, выполнять задачи в реальном интерфейсе – так, как это сделал бы живой человек.

Компания H представила Holo3 – новую версию своей модели, ориентированной именно на эту задачу. И, судя по результатам тестирования, это не просто очередной релиз ради релиза.

Что такое OSWorld тест для ИИ и его роль

Что такое OSWorld и почему это важно?

Чтобы понять, почему результат Holo3 вызывает интерес, стоит сначала разобраться с тем, как вообще измеряют способность ИИ работать за компьютером.

Существует специальный тест – OSWorld-Verified. Если коротко, это набор реальных задач на обычном рабочем столе: открыть файл, найти нужную информацию, произвести действие в браузере или офисном приложении. Модель должна сама «видеть» экран и выполнять шаги – без подсказок, без специальных адаптеров, в условиях, максимально приближённых к реальной работе.

Это принципиально сложнее, чем решать задачи по математике или писать код в изолированной среде. Здесь нет чёткого «правильного ответа» – есть реальный интерфейс, который может повести себя неожиданно, и задача, которую нужно довести до конца.

Показатель 78,85% для ИИ-агентов: оценка успеха

78,85% – это много или мало?

Holo3-122B-A10B набрала 78,85% на OSWorld-Verified, установив новый рекорд среди всех известных моделей в этом тесте.

Для сравнения: несколько месяцев назад результаты лучших агентов на аналогичных задачах были значительно скромнее. Гонка здесь идёт стремительно – примерно так же, как в прошлом году ускорилась гонка языковых моделей после того, как стало ясно, что монополии на прогресс не существует.

Цифра 78,85% означает, что модель справляется почти с четырьмя задачами из пяти в условиях реального рабочего стола. Оставшиеся ~21% – это пространство, где что-то идёт не так: нестандартный интерфейс, неожиданная последовательность действий, пограничная ситуация.

Проще говоря, это уже не «демонстрационная игрушка», но ещё и не инструмент, которому можно доверить что угодно без присмотра.

Концепция «Автономное предприятие» в ИИ-разработке

«Автономное предприятие» – что это за идея?

H позиционирует Holo3 как часть концепции, которую компания называет Autonomous Enterprise – «автономное предприятие».

Идея здесь вот в чём: большая часть офисной работы – это повторяющиеся действия за компьютером. Заполнить отчёт, перенести данные из одной системы в другую, проверить статус задачи, ответить на стандартный запрос. Человек тратит на это часы. ИИ-агент, умеющий работать с обычным интерфейсом, мог бы делать это сам – без специальной интеграции, без API, без того, чтобы под каждую задачу писать отдельный скрипт.

Это принципиально отличается от подхода «подключи ИИ к своей базе данных через API». Агент просто смотрит на экран и действует – как новый сотрудник, которому показали рабочий компьютер.

Развитие ниши ИИ-агентов: актуальность и тенденции

Почему сейчас, и что происходит в этой нише?

Интерес к компьютерным агентам резко вырос в последние месяцы. Это не случайно.

Во-первых, языковые модели достигли уровня, при котором они достаточно надёжно понимают инструкции и контекст – и им можно доверить выполнение многошаговых задач. Во-вторых, появились методы, позволяющие модели «видеть» экран и интерпретировать визуальный интерфейс, а не только текст.

OpenAI движется в том же направлении: GPT-5.4, выпущенная в начале марта 2026 года, была представлена именно как первая модель компании со встроенной поддержкой работы на компьютере пользователя в режиме агента. Alibaba в своём мультимодальном Qwen3.5-Omni обнаружила, что модель способна писать код, просматривая видеозапись экрана – причём эту способность не закладывали намеренно, она возникла сама.

То есть сразу несколько крупных игроков движутся к одной точке, но с разных сторон. H идёт напрямую – через специализированную модель, заточенную именно под управление рабочим столом.

Практическое применение ИИ-агентов: текущее состояние

Что это означает на практике?

Если коротко – пока ещё немного, но вектор понятен.

Результат 78,85% в тесте – это не то же самое, что «работает в реальной компании». Тест устроен аккуратно, условия воспроизводимы. Реальный офис – это другое: старые версии программ, нестандартные конфигурации, задачи, которые никто не формулировал явно.

Но такие результаты говорят о том, что технология перешла из стадии «интересный эксперимент» в стадию «это уже можно использовать в контролируемых условиях». Следующий шаг – расширение этих условий до чего-то более похожего на реальную рабочую среду.

Для разработчиков и компаний, которые следят за автоматизацией бизнес-процессов, это сигнал: агенты, умеющие работать с обычным компьютерным интерфейсом, – уже не фантастика и не далёкое будущее. Это активно развивающаяся ниша, в которой результаты меняются буквально каждые несколько недель.

Открытым остаётся вопрос надёжности: насколько такой агент справляется, когда что-то идёт не по плану? Как он реагирует на ошибку? Умеет ли остановиться и сообщить о проблеме, а не продолжать действовать в неверном направлении? Это то, что пока сложно измерить одним числом – и то, что будет определять реальную применимость подобных систем.

#событие #аналитика #развитие ии #компьютерные системы #человеко-машинное взаимодействие #генеративные агенты #бенчмаркинг агентов #операционные системы

Ссылка на публикацию: https://hcompany.ai/holo3

Оригинальное название: Holo3

Дата публикации: 31 мар 2026

H Company hcompany.ai Французская ИИ-компания, разрабатывающая интеллектуальных агентов и модели для автоматизации сложных цифровых и бизнес-процессов.

Предыдущая статья ИИ-заводы как часть энергосети: NVIDIA и партнёры меняют подход к потреблению электричества Следующая статья LFM2.5-350M: маленькая модель с большими амбициями

Holo3 устанавливает рекорд ИИ-агентов по работе за компьютером

Что такое OSWorld тест для ИИ и его роль

Показатель 78,85% для ИИ-агентов: оценка успеха

Концепция «Автономное предприятие» в ИИ-разработке

Развитие ниши ИИ-агентов: актуальность и тенденции

Практическое применение ИИ-агентов: текущее состояние

Связанные публикации

GPT-5.4 mini и nano: OpenAI выпустила компактные версии своей модели

Mercury 2: быстрые ИИ-модели и первые шаги к личному помощнику

ИИ-агенты под угрозой: что показала проверка 30 000 навыков в каталоге Alibaba Cloud

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации