От «ответь на вопрос» к «реши задачу самостоятельно»
Еще несколько лет назад разговор об искусственном интеллекте в бизнесе сводился к одному сценарию: пользователь задает вопрос – модель отвечает. Все было просто, понятно и предсказуемо. Сегодня картина меняется: компании активнее переходят к агентному ИИ – системам, которые не просто генерируют текст, а самостоятельно ставят цели, выбирают инструменты и последовательно выполняют сложные задачи.
Проще говоря: раньше ИИ был умным помощником, у которого спрашивали совета. Теперь он становится сотрудником, которому поручают работу.
Именно эта тема оказалась в центре внимания на AAAI 2026 – одной из ведущих мировых конференций по искусственному интеллекту. Исследовательское подразделение LG AI Research представило там четыре работы, охватывающие разные направления: от причинно-следственного анализа до обучения с подкреплением. Но главный нерв события заключался в другом: не в том, насколько мощными стали агенты, а в том, можно ли им доверять и как именно это доверие выстроить.
Автономность – это хорошо. Непрозрачность – уже проблема
Когда агент действует самостоятельно, он принимает множество промежуточных решений: к каким данным обратиться, какой инструмент задействовать, как интерпретировать результат. И здесь возникает серьезная проблема: отследить логику этих шагов крайне сложно.
Представьте, что новый сотрудник выполнил задачу, но не может объяснить, почему выбрал именно такой подход. Или что в его действиях закралась ошибка, но найти этап, на котором она произошла, невозможно. С агентными системами история та же, только масштаб потенциальных последствий значительно выше.
Языковые модели по своей природе работают вероятностно: они генерируют то, что «звучит правдоподобно». В большинстве случаев это совпадает с правильным ответом. Но в бизнес-процессах «правдоподобно» и «корректно» – не одно и то же. Агент может нарушить регламент, обойти ограничение или принять решение, противоречащее политике компании, причем сделает это очень убедительно.
Именно поэтому на AAAI 2026 так много внимания уделялось не производительности моделей, а архитектурным подходам, которые делают поведение агентов наблюдаемым и объяснимым.
Когда знания структурированы, а не просто «известны»
Один из ключевых инструментов решения этой проблемы – онтологии и графы знаний. Звучит сложно, но суть проста: это способ организации знаний в виде явных связей между понятиями, а не просто хранение данных в «памяти» модели.
Если обычная языковая модель «знает» что-то, потому что видела это в обучающей выборке, то граф знаний хранит факты и отношения в структурированном виде – как база данных, состоящая не из таблиц, а из связей между сущностями. Это позволяет агенту не просто выдавать ответ, а рассуждать логически: «Из A следует B, B связано с C, значит...»
На конференции представили два исследования, развивающих этот подход.
PathMind решает проблему «шумных» рассуждений: когда агент ищет ответ, он может перебирать огромное количество путей в графе знаний, большинство из которых нерелевантны. PathMind предлагает сначала отобрать наиболее перспективные маршруты и только затем строить логические цепочки. Это снижает нагрузку на систему и повышает точность, особенно в задачах с множеством последовательных шагов.
DoM работает с другой трудностью: что делать, если граф знаний неполный? Ведь реальные базы данных редко бывают идеальными. Решение нашли в «дебатах» между агентами: один опирается на граф знаний, другой – на обычный поиск по тексту, а третий выступает арбитром и сравнивает аргументы. В результате итоговый ответ получается более надежным, чем если бы каждый агент работал в одиночку.
Три инструмента, которые делают агента «стеклянным»
Демонстрационный трек конференции был посвящен практическому вопросу: как превратить агента из «черного ящика» в систему, за которой можно наблюдать и которую можно проверять.
Три представленных инструмента предлагают разные подходы к этой задаче.
AgentGraph: карта решений вместо тысяч строк логов
Когда агент выполняет задачу, он генерирует огромный журнал действий. Прочитать его и понять, в какой момент что-то пошло не так, почти нереально. AgentGraph преобразует этот журнал в визуальный граф: узлы – это задачи и инструменты, ребра – связи между ними. Разработчик может буквально «кликнуть» на любую точку и увидеть, какое именно действие за ней стоит.
Помимо визуализации, инструмент позволяет тестировать устойчивость агента – например, проверять, как он реагирует на попытки манипуляции или некорректные запросы.
AgentSeer: проверка безопасности на каждом шаге
Стандартный подход к безопасности ИИ – проверять финальный ответ агента. AgentSeer идет глубже: он анализирует каждое промежуточное действие – обращение к памяти, вызов инструмента, взаимодействие с другими агентами.
Это важно, так как финальный результат может выглядеть безопасным, в то время как на середине пути агент уже совершил критическую ошибку. AgentSeer моделирует атаки на каждом этапе и выявляет уязвимости, которые традиционное тестирование просто не замечает.
Omega: «объясни, почему ты так решил»
Omega помогает в ситуациях, когда в сложных операционных средах нужно понять мотивы агента: почему он выбрал именно этот маршрут или действие?
Изначально инструмент разрабатывался для задач, где несколько агентов одновременно перемещаются в общем пространстве (например, роботы на складе). Но подход универсален: Omega берет журнал действий, накладывает на него структуру из онтологии (явных правил предметной области) и генерирует объяснение на человеческом языке. Не просто «агент выбрал путь A», а «агент выбрал путь A, так как путь B был заблокирован, а приоритет задачи C оказался выше».
Это особенно ценно в случаях, когда после инцидента нужно восстановить цепочку причин и четко ответить, что произошло и почему.
Что это означает для бизнеса
Если суммировать итоги конференции, главный вывод звучит так: автономность агента без прозрачности его действий – это высокий управленческий риск.
Пока агент помогает написать письмо или составить отчет, цена ошибки невелика. Но когда он самостоятельно взаимодействует с внешними системами, принимает решения в бизнес-процессах или координирует других агентов, вопрос «почему он так решил?» перестает быть теоретическим.
Именно поэтому центральная идея AAAI 2026 – не «сделайте агента умнее», а «сделайте его объяснимым». Онтологии, графы знаний и инструменты наблюдаемости – это не надстройки, а фундаментальные части архитектуры. Без них доверять ИИ-агентам серьезные задачи попросту нельзя.
Агенты, способные не только действовать, но и обосновывать свои решения, – это следующий практический рубеж. И судя по дискуссиям на конференции, работа в этом направлении уже перешла в прикладную плоскость.