Есть класс задач, который долгое время считался особенно сложным для ИИ: не написать текст или решить уравнение, а просто работать с компьютером – открывать приложения, переключаться между ними, выполнять многошаговые инструкции так, как это делает живой сотрудник. Именно на этом направлении компания Hcompany представила свою новую модель – Holo3.
На 1 апреля 2026 года Holo3 показала результат 78,85% на бенчмарке OSWorld-Verified – это лучший показатель среди всех систем, протестированных в данной эталонной проверке по управлению компьютером. Проще говоря, именно этот тест считается в индустрии главной меркой того, насколько хорошо ИИ-агент умеет работать с реальным десктопным окружением.
Мощно, но не дорого
Один из неочевидных моментов в этой истории – экономика модели. Holo3 в своей основной версии (122B-A10B) использует всего 10 миллиардов активных параметров при общем числе в 122 миллиарда. Это архитектурное решение позволяет модели работать значительно дешевле, чем крупные проприетарные системы – в частности, GPT 5.4 или Opus 4.6, с которыми Hcompany её сравнивает.
Кроме того, существует облегчённая версия – Holo3-35B-A3B, веса которой опубликованы в открытом доступе под лицензией Apache 2.0. Это означает, что разработчики могут использовать модель свободно, в том числе в коммерческих проектах. Обе версии доступны через Inference API компании, а меньшая из них – ещё и на бесплатном тарифе.
Как модель «учится» работать с интерфейсами
За результатами стоит специализированный подход к обучению, который в Hcompany называют агентным маховиком (agentic flywheel). Идея в том, чтобы не просто натренировать модель на статичных примерах, а выстроить непрерывную петлю обратной связи, которая шлифует два ключевых навыка: умение воспринимать происходящее на экране и умение принимать решения о следующем шаге.
На практике это выглядит так: модель обучается на сгенерированных примерах навигации по интерфейсам – как созданных людьми, так и синтетических. Затем эти сценарии программно расширяются, чтобы модель не терялась при неожиданных ситуациях. Финальный этап – тщательная фильтрация данных и обучение с подкреплением, позволяющее выжимать максимум из каждого обучающего примера.
Смысл этого подхода – не просто заставить модель хорошо справляться с конкретными приложениями, а сформировать у неё обобщённое понимание того, как устроены цифровые интерфейсы в целом. Это важно, потому что корпоративный ландшафт программного обеспечения крайне разнообразен, и агент, обученный только на знакомых инструментах, окажется бесполезным при встрече с чем-то новым.
«Завод» синтетических сред
Чтобы перенести эти навыки в реальные рабочие сценарии, Hcompany разработала собственную инфраструктуру – Synthetic Environment Factory («Фабрика синтетических сред»). Это система, которая автоматически воссоздаёт корпоративные программные среды: сайты, инструменты, рабочие процессы. Всё это строится с нуля при помощи других ИИ-агентов, которые программируют окружение по заданным спецификациям.
В итоге получается практически неограниченный набор тренировочных ситуаций – от простых задач в одном приложении до сложных многошаговых сценариев, где агенту нужно работать сразу с несколькими системами.
Для оценки реальной готовности модели к корпоративной работе компания также создала собственный набор тестов – H Corporate Benchmarks («Корпоративные бенчмарки H»). Он включает 486 задач, разбитых на четыре категории: электронная коммерция, бизнес-приложения, инструменты совместной работы и сценарии, требующие одновременного использования нескольких программ.
Один из примеров задач высокого уровня сложности – агенту нужно достать цены на оборудование из PDF-файла, сопоставить их с остатками бюджета каждого сотрудника и автоматически разослать персонализированные письма с одобрением или отказом. Это не абстрактный тест на логику – это буквально то, что может делать реальный сотрудник в реальной компании.
Что дальше
В Hcompany прямо говорят, что Holo3 – это веха, а не финальная точка. Следующий этап в их дорожной карте называется Adaptive Agency («Адаптивное агентство»). Идея в том, что будущие модели смогут не просто работать с уже знакомым им программным обеспечением, но и самостоятельно разбираться в новых, незнакомых корпоративных системах – в режиме реального времени, без предварительного обучения на них.
Если Holo3 умеет мастерски обращаться с интерфейсами, которые видел раньше, то следующее поколение должно уметь адаптироваться к тому, чего не видело никогда. Это принципиально другой уровень автономности – и именно к нему, судя по всему, движется Hcompany в своей концепции Автономного предприятия.
Пока что Holo3 – это первая публично верифицированная демонстрация того, что агентный ИИ, обученный на синтетических корпоративных средах, способен превзойти значительно более крупные модели на задачах, максимально приближенных к реальной офисной работе. Насколько этот результат удастся перенести в повседневную практику конкретных компаний – вопрос, который покажет только реальная эксплуатация.