Опубликовано 4 апреля 2026

Как языковые модели ускоряют запросы в базах данных

Когда база данных «думает»: как языковые модели ускоряют запросы

Исследователи выяснили, что языковые модели способны оптимизировать выполнение запросов к базам данных и делают это значительно эффективнее привычных статистических методов.

Исследования 4 – 5 минут чтения

Источник события: Together.ai 4 – 5 минут чтения

Базы данных – система незаметная, но важная. Каждый раз, когда вы что-то ищете в приложении, оформляете заказ или просто открываете ленту, где-то в фоне выполняется запрос к базе данных. Скорость обработки этого запроса определяет многое: быстродействие ответа, нагрузку на серверы, стоимость инфраструктуры.

Звучит технически, но суть проста: базы данных постоянно принимают решения о том, как именно выполнять тот или иной запрос. И принимают их не всегда оптимально. Новое исследование предлагает передать часть этих решений языковым моделям, и результаты оказались неожиданно убедительными.

Почему запросы к базам данных бывают медленными

Откуда берётся медленный запрос

Когда система управления базой данных получает запрос, она не просто выполняет его напрямую. Сначала она строит так называемый план выполнения – последовательность шагов, которая должна привести к нужному результату с наименьшими затратами. Выбор плана – это целая внутренняя оптимизация: как соединять таблицы, в каком порядке обрабатывать данные, где использовать индексы.

Ключевой момент в этом процессе – оценка количества строк, которые вернёт каждый промежуточный шаг. Проще говоря, система пытается предугадать: «если я применю вот это условие, сколько записей останется?» Это называется оценкой кардинальности. И именно здесь часто возникают проблемы.

Классические методы оценки опираются на статистику: гистограммы, выборки, усреднённые показатели. Они хорошо работают в простых случаях, но дают сбой, когда запрос сложный – например, когда нужно соединить несколько таблиц с неочевидными условиями. В таких ситуациях ошибки в оценке кардинальности приводят к тому, что система выбирает неоптимальный план. И запрос, который мог выполниться за секунду, обрабатывается несколько минут.

Языковая модель как оптимизатор запросов

Языковая модель как планировщик запросов

Исследователи задались вопросом: а что если использовать большую языковую модель, чтобы она анализировала запрос и предлагала лучший план выполнения?

На первый взгляд это звучит необычно. Языковые модели обычно работают с текстом – они пишут, переводят, отвечают на вопросы. Причём тут базы данных?

Но если задуматься, SQL-запрос – это тоже текст, причём структурированный. И у языковой модели, обученной на огромных объёмах данных, включая документацию, код и описания схем баз данных, есть шанс «понять» контекст запроса лучше, чем это делают статистические эвристики.

Именно это и проверялось в исследовании. Модель получала на вход SQL-запрос и информацию о структуре базы данных, а на выходе должна была предложить подсказки для планировщика – в частности, скорректированные оценки кардинальности. Эти подсказки затем передавались обратно в систему управления базой данных, которая уже строила план с учётом новой информации.

- Итоги применения языковых моделей для оптимизации

Что показали эксперименты

Для тестирования использовался стандартный отраслевой бенчмарк (эталонный тест) – набор аналитических запросов, который широко применяется для оценки производительности баз данных. Это не синтетические примеры из учебника, а достаточно реалистичные сценарии с множеством соединений таблиц и сложными условиями фильтрации.

Результаты оказались впечатляющими. В ряде случаев запросы выполнялись в 4,78 раза быстрее, чем без вмешательства модели. Это не единичный пример – ускорение наблюдалось на множестве запросов, где стандартный планировщик ошибался в оценках.

При этом подход не требовал переписывать базу данных или менять её архитектуру. Языковая модель работала как внешний советник: она анализировала запрос, давала рекомендации, а дальше всё происходило внутри привычной системы.

Ограничения использования ИИ в оптимизации запросов

Почему это не так просто, как кажется

Конечно, есть и ограничения, и о них важно говорить честно.

Во-первых, языковая модель может ошибаться. Если её оценки окажутся хуже стандартных, план выполнения станет только медленнее. Это означает, что такой подход требует аккуратной интеграции: либо с механизмом проверки, либо с возможностью откатиться к исходному плану.

Во-вторых, вызов языковой модели – это дополнительное время. Для аналитических запросов, которые и без того выполняются долго, небольшая задержка на «консультацию» с моделью может быть оправданна. Но для коротких запросов, которые должны выполняться за миллисекунды, это может быть неприемлемо.

В-третьих, модели нужно понимать схему конкретной базы данных. В экспериментах эта информация передавалась явно, но в реальных промышленных системах схемы бывают огромными и постоянно меняются – это отдельная инженерная задача.

ИИ в инфраструктуре: от научного поиска до реальных решений

ИИ внутри инфраструктуры – не фантастика

Это исследование вписывается в более широкую тенденцию: языковые модели начинают применяться не только как интерфейс для пользователя, но и как компонент внутри технических систем – там, где раньше правили строгие алгоритмы и статистика.

Оптимизация баз данных – сложная область, которая десятилетиями развивалась своим путём. То, что языковая модель способна внести в неё измеримый вклад без специализированного дообучения под конкретную задачу, – это само по себе любопытный результат.

Пока это скорее доказательство концепции, чем готовое производственное решение. Но направление обозначено чётко: ИИ постепенно проникает в слои инфраструктуры, которые раньше казались далёкими от машинного обучения. И судя по результатам, иногда это действительно помогает работать быстрее.

#аналитика #прикладной разбор #нейросети #машинное обучение #компьютерные системы #инфраструктура #данные #оптимизация моделей #оптимизация запросов бд

Ссылка на публикацию: https://www.together.ai/blog/using-llms-to-optimize-database-query-execution

Оригинальное название: AI for Systems: Using LLMs to Optimize Database Query Execution

Дата публикации: 3 апр 2026

Together.ai www.together.ai Американская платформа для запуска и масштабирования открытых ИИ-моделей.

Предыдущая статья Как обучают большие языковые модели: что скрывается за масштабированием Следующая статья Wan 2.7: новый набор ИИ-инструментов для работы с видео

Как языковые модели ускоряют запросы в базах данных

Почему запросы к базам данных бывают медленными

Языковая модель как оптимизатор запросов

- Итоги применения языковых моделей для оптимизации

Ограничения использования ИИ в оптимизации запросов

ИИ в инфраструктуре: от научного поиска до реальных решений

Связанные публикации

DAS Agent от Alibaba Cloud: одно окно для всех баз данных вместо хаоса из консолей

Perplexity выпустила собственные модели для поиска по огромным массивам текста

DeepSeek на новом оборудовании NVIDIA: что изменилось для обработки длинных текстов

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации