Опубликовано 19 марта 2026

ИИ-агенты теперь ищут по видео, аудио и таблицам: File Search Yandex AI Studio

Yandex AI Studio научила агентов искать по файлам, включая видео и аудио

Yandex AI Studio обновила инструмент поиска по файлам: теперь ИИ-агенты могут работать с таблицами, аудио и видео, находя нужное в корпоративных базах знаний.

Продукты 4 – 5 минут чтения
Источник события: Yandex Cloud 4 – 5 минут чтения

Работать с корпоративными данными через ИИ – задача, которая звучит просто, но на практике часто упирается в одно: модель не умеет нормально искать по вашим файлам. Особенно если эти файлы – не аккуратные текстовые документы, а таблицы, записи встреч или обучающие видео.

Yandex AI Studio обновила встроенный инструмент для ИИ-агентов под названием File Search. Если вкратце: теперь агенты могут не просто работать с текстом, но и искать нужную информацию в таблицах, аудиофайлах и видео.

Что такое File Search и для чего он нужен

Что такое File Search и зачем он нужен

ИИ-агент – это не просто чат-бот, который отвечает на вопросы. Это более самостоятельная система, способная использовать инструменты: искать в интернете, вызывать функции, обращаться к базам данных. File Search – один из таких инструментов, позволяющий агенту искать по загруженным файлам и находить в них релевантные фрагменты.

Проще говоря: вы загружаете свои документы, а агент умеет по ним «ориентироваться» – находить нужное место, не читая всё подряд.

Это особенно актуально для корпоративных сценариев. У компании может быть внутренняя база знаний: регламенты, инструкции, записи звонков, финансовые таблицы. Ранее агент мог работать с такими данными лишь ограниченно. Теперь возможностей стало больше.

Что нового в обновлении File Search

Что изменилось в обновлении

Ключевое расширение – поддержка новых типов файлов. Раньше инструмент в основном ориентировался на текстовые форматы. Теперь добавились:

  • Таблицы – агент может искать по содержимому Excel-файлов и CSV, находить нужные строки или значения.
  • Аудио – файлы с записями речи сначала расшифровываются, а затем становятся доступны для поиска.
  • Видео – аналогично: из видео извлекается звуковая дорожка, она распознаётся, и агент может искать по этой расшифровке.

Это значит, что теперь можно, например, загрузить запись совещания и попросить агента найти момент, где обсуждался конкретный вопрос. Или загрузить таблицу с данными по продажам и задать вопрос в свободной форме – агент сам разберётся, где искать.

Как работает семантический поиск по файлам

Как это работает на уровне идеи

Поиск по файлам в таких системах устроен не как обычный Ctrl+F. Когда файл загружается, система разбивает его на фрагменты и представляет каждый из них в виде числового «отпечатка» – своеобразного смыслового слепка. Когда агент получает вопрос, он точно так же «кодирует» этот вопрос и ищет наиболее близкие по смыслу фрагменты из загруженных файлов.

Это позволяет находить нужное даже тогда, когда формулировка вопроса не совпадает дословно с текстом в документе. Такой подход называют семантическим поиском – поиском по смыслу, а не по ключевым словам.

Для аудио и видео добавляется предварительный шаг: сначала речь переводится в текст, и уже по нему работает тот же механизм.

Сценарии применения обновленного File Search

Где это может пригодиться

Несколько сценариев, в которых обновлённый File Search выглядит практично:

  • Служба поддержки – агент работает с базой внутренних инструкций и быстро находит ответ на нестандартный вопрос клиента.
  • HR и обучение – загружены видеозаписи тренингов, и новый сотрудник может задавать вопросы и получать ответы со ссылкой на конкретный фрагмент.
  • Финансы и аналитика – агент обращается к таблицам с данными и отвечает на вопросы без необходимости вручную строить запросы.
  • Юридический и compliance-отдел – поиск по большим массивам документов, договоров или регламентов.

Во всех этих случаях ключевое – не нужно заранее структурировать данные под ИИ. Достаточно загрузить то, что уже есть.

Особенности работы семантического поиска

Что стоит иметь в виду

Семантический поиск по файлам – мощный инструмент, но у него есть характерные особенности. Он хорошо справляется с задачами по поиску «по смыслу», но может ошибиться в деталях: перепутать похожие фрагменты, не заметить тонкую разницу в формулировках или вернуть не самый точный отрывок. Это не ошибка конкретной реализации – это общее свойство подхода.

Для задач, где важна точность до символа (например, поиск конкретной цифры в таблице), стоит дополнительно проверять результат. Для задач, где нужно «найти примерно об этом» – работает хорошо.

Также важно помнить, что качество поиска по аудио и видео напрямую зависит от качества распознавания речи. Если запись плохая, с сильным акцентом или техническим шумом – результат может быть менее точным.

В итоге

Обновление File Search в Yandex AI Studio – это шаг к тому, чтобы ИИ-агенты могли работать с реальными корпоративными данными, а не только с аккуратно подготовленными текстами. Поддержка таблиц, аудио и видео расширяет круг сценариев, где агент может быть полезен без долгой предварительной подготовки данных.

Для тех, кто строит внутренние инструменты на базе ИИ или только присматривается к такой возможности, это обновление стоит иметь в виду – особенно если в компании накоплено много «живого» контента: записей, таблиц, неструктурированных документов.

Ссылка на публикацию: https://yandex.cloud/ru/blog/ai-studio-file-search
Оригинальное название: Новые возможности поиска по файлам в Yandex AI Studio
Дата публикации: 18 мар 2026
Yandex Cloud yandex.cloud Российская облачная платформа с ИИ-сервисами для данных, речи и изображений.
Предыдущая статья Together AI расширяет возможности дообучения моделей: теперь с поддержкой инструментов, рассуждений и зрения Следующая статья Архитектура SK Telecom для связи ИИ-дата-центров стала международным стандартом ITU-T

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться