Опубликовано 19 марта 2026

ИИ-агенты теперь ищут по видео, аудио и таблицам: File Search Yandex AI Studio

Yandex AI Studio научила агентов искать по файлам, включая видео и аудио

Yandex AI Studio обновила инструмент поиска по файлам: теперь ИИ-агенты могут работать с таблицами, аудио и видео, находя нужное в корпоративных базах знаний.

Продукты 4 – 5 минут чтения
Источник события: Yandex Cloud 4 – 5 минут чтения

Работать с корпоративными данными через ИИ – задача, которая звучит просто, но на практике часто упирается в одно: модель не умеет нормально искать по вашим файлам. Особенно если эти файлы – не аккуратные текстовые документы, а таблицы, записи встреч или обучающие видео.

Yandex AI Studio обновила встроенный инструмент для ИИ-агентов под названием File Search. Если вкратце: теперь агенты могут не просто работать с текстом, но и искать нужную информацию в таблицах, аудиофайлах и видео.

Что такое File Search и для чего он нужен

Что такое File Search и зачем он нужен

ИИ-агент – это не просто чат-бот, который отвечает на вопросы. Это более самостоятельная система, способная использовать инструменты: искать в интернете, вызывать функции, обращаться к базам данных. File Search – один из таких инструментов, позволяющий агенту искать по загруженным файлам и находить в них релевантные фрагменты.

Проще говоря: вы загружаете свои документы, а агент умеет по ним «ориентироваться» – находить нужное место, не читая всё подряд.

Это особенно актуально для корпоративных сценариев. У компании может быть внутренняя база знаний: регламенты, инструкции, записи звонков, финансовые таблицы. Ранее агент мог работать с такими данными лишь ограниченно. Теперь возможностей стало больше.

Что нового в обновлении File Search

Что изменилось в обновлении

Ключевое расширение – поддержка новых типов файлов. Раньше инструмент в основном ориентировался на текстовые форматы. Теперь добавились:

  • Таблицы – агент может искать по содержимому Excel-файлов и CSV, находить нужные строки или значения.
  • Аудио – файлы с записями речи сначала расшифровываются, а затем становятся доступны для поиска.
  • Видео – аналогично: из видео извлекается звуковая дорожка, она распознаётся, и агент может искать по этой расшифровке.

Это значит, что теперь можно, например, загрузить запись совещания и попросить агента найти момент, где обсуждался конкретный вопрос. Или загрузить таблицу с данными по продажам и задать вопрос в свободной форме – агент сам разберётся, где искать.

Как работает семантический поиск по файлам

Как это работает на уровне идеи

Поиск по файлам в таких системах устроен не как обычный Ctrl+F. Когда файл загружается, система разбивает его на фрагменты и представляет каждый из них в виде числового «отпечатка» – своеобразного смыслового слепка. Когда агент получает вопрос, он точно так же «кодирует» этот вопрос и ищет наиболее близкие по смыслу фрагменты из загруженных файлов.

Это позволяет находить нужное даже тогда, когда формулировка вопроса не совпадает дословно с текстом в документе. Такой подход называют семантическим поиском – поиском по смыслу, а не по ключевым словам.

Для аудио и видео добавляется предварительный шаг: сначала речь переводится в текст, и уже по нему работает тот же механизм.

Сценарии применения обновленного File Search

Где это может пригодиться

Несколько сценариев, в которых обновлённый File Search выглядит практично:

  • Служба поддержки – агент работает с базой внутренних инструкций и быстро находит ответ на нестандартный вопрос клиента.
  • HR и обучение – загружены видеозаписи тренингов, и новый сотрудник может задавать вопросы и получать ответы со ссылкой на конкретный фрагмент.
  • Финансы и аналитика – агент обращается к таблицам с данными и отвечает на вопросы без необходимости вручную строить запросы.
  • Юридический и compliance-отдел – поиск по большим массивам документов, договоров или регламентов.

Во всех этих случаях ключевое – не нужно заранее структурировать данные под ИИ. Достаточно загрузить то, что уже есть.

Особенности работы семантического поиска

Что стоит иметь в виду

Семантический поиск по файлам – мощный инструмент, но у него есть характерные особенности. Он хорошо справляется с задачами по поиску «по смыслу», но может ошибиться в деталях: перепутать похожие фрагменты, не заметить тонкую разницу в формулировках или вернуть не самый точный отрывок. Это не ошибка конкретной реализации – это общее свойство подхода.

Для задач, где важна точность до символа (например, поиск конкретной цифры в таблице), стоит дополнительно проверять результат. Для задач, где нужно «найти примерно об этом» – работает хорошо.

Также важно помнить, что качество поиска по аудио и видео напрямую зависит от качества распознавания речи. Если запись плохая, с сильным акцентом или техническим шумом – результат может быть менее точным.

В итоге

Обновление File Search в Yandex AI Studio – это шаг к тому, чтобы ИИ-агенты могли работать с реальными корпоративными данными, а не только с аккуратно подготовленными текстами. Поддержка таблиц, аудио и видео расширяет круг сценариев, где агент может быть полезен без долгой предварительной подготовки данных.

Для тех, кто строит внутренние инструменты на базе ИИ или только присматривается к такой возможности, это обновление стоит иметь в виду – особенно если в компании накоплено много «живого» контента: записей, таблиц, неструктурированных документов.

Ссылка на публикацию: https://yandex.cloud/ru/blog/ai-studio-file-search
Оригинальное название: Новые возможности поиска по файлам в Yandex AI Studio
Дата публикации: 18 мар 2026
Yandex Cloud yandex.cloud Российская облачная платформа с ИИ-сервисами для данных, речи и изображений.
Предыдущая статья Together AI расширяет возможности дообучения моделей: теперь с поддержкой инструментов, рассуждений и зрения Следующая статья Архитектура SK Telecom для связи ИИ-дата-центров стала международным стандартом ITU-T

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться