Проблема, которую сложно заметить со стороны
Когда ИИ-агент отвечает на вопрос – например, помогает разобраться в документации, ищет нужный файл или анализирует массив данных, – он не рассуждает сам по себе. Сначала он выполняет поиск: находит релевантные фрагменты информации и только потом формулирует ответ на их основе.
Это означает, что качество ответа напрямую зависит от качества поиска. Если агент не нашел нужный фрагмент текста, он либо ответит неверно, либо признается, что не знает решения. И это не проблема «интеллекта» модели, а проблема системы поиска.
У данного явления есть устоявшееся название – oracle gap, или «разрыв с оракулом». Имеется в виду разница между тем, что агент находит на самом деле, и тем, что он обнаружил бы при идеальном доступе к информации – подобно воображаемому оракулу, который всегда точно знает, где лежит ответ.
Именно эту задачу стремится решить компания Mixedbread с выходом своей новой поисковой модели Search v3.
Что такое поисковая модель и при чем тут агенты
Проще говоря, поисковая модель – это не тот ИИ, с которым вы переписываетесь в чате. Это «закулисный» компонент, задача которого – по запросу агента отобрать в огромном массиве документов именно те фрагменты, которые помогут дать правильный ответ.
Если представить агента в роли сотрудника, то поисковая модель – это корпоративный архив. Чем лучше он организован и чем точнее выдает материалы по запросу, тем эффективнее работает специалист.
Эта задача стала особенно актуальной, когда агентов начали внедрять в реальные рабочие сценарии: поиск по внутренним базам знаний, работу с юридическими или медицинскими документами, навигацию по офисным файлам. Там, где вопросы сложны, а ответы спрятаны глубоко, обычный поиск по ключевым словам не справляется.
Откуда берется разрыв
Представьте: у вас есть тысяча документов, и агент должен ответить на конкретный вопрос. Идеальная система нашла бы ровно тот абзац, где содержится ответ. Реальная система часто выдает что-то близкое, но не всегда то, что нужно.
Этот зазор между «нашли» и «нашли бы в идеале» и есть тот самый oracle gap. Он возникает по нескольким причинам:
- Вопрос сформулирован иначе, чем ответ в документе.
- Нужная информация рассредоточена по нескольким источникам, и ее необходимо собрать воедино.
- Документы имеют сложную структуру: таблицы, вложенные разделы, нестандартные форматы.
- Поиск не понимает контекста задачи агента, ограничиваясь буквальным прочтением запроса.
Чем сложнее задача, тем шире этот разрыв. И тем заметнее он становится, когда агент работает не с простыми справками, а с реальной деловой документацией.
Search v3: что изменилось
Mixedbread специализируется на поисковых технологиях для ИИ-систем. Их новая модель Search v3 разрабатывалась специально для агентных сценариев – тех случаев, когда поиск является не вспомогательной функцией, а критически важным этапом в цепочке рассуждений агента.
Согласно опубликованным результатам, Search v3 показала лучшие показатели на бенчмарке BrowseComp-Plus – наборе задач, созданном для оценки поиска в сложных многошаговых сценариях. Кроме того, модель продемонстрировала высокие результаты на MADQA и OfficeQA-Pro – тестах, имитирующих работу с корпоративной документацией и офисными файлами.
Говоря простым языком, модель лучше справляется именно с теми ситуациями, где предыдущие решения давали сбой: с нестандартными, запутанными или многоуровневыми запросами, типичными для профессиональной среды.
Почему это важно не только разработчикам
На первый взгляд может показаться, что речь идет об узкоспециализированном инструменте. Отчасти это так, но существует и более широкий контекст.
Мы находимся в точке, когда ИИ-агенты активно внедряются в бизнес-процессы: юридические фирмы используют их для анализа договоров, компании – для навигации по базам знаний, исследователи – для работы с научной литературой. Во всех этих случаях именно качество поиска определяет, будет ли агент полезен.
Совершенствование поиска – это не просто техническая деталь. От этого зависит, станет ли агент реальным помощником или будет уверенно выдавать ошибочные ответы.
Открытые вопросы
Результаты бенчмарков – хорошая отправная точка, но не исчерпывающий ответ. Тесты, даже качественно составленные, всегда упрощают реальность. Как Search v3 поведет себя на специфических корпоративных данных, редких языках или в нишевых отраслях – покажет только практика.
Кроме того, поиск – лишь часть системы. Даже безупречный алгоритм не спасет положение, если сам агент плохо формулирует запросы или не умеет интерпретировать найденную информацию. Разрыв с «оракулом» можно сокращать с двух сторон, и развитие поисковых моделей решает лишь одну часть проблемы.
Тем не менее сам факт того, что индустрия начинает всерьез измерять и целенаправленно уменьшать этот разрыв, весьма показателен. Это признак зрелости технологий: переход от этапа «агент отвечает» к этапу «агент отвечает правильно».