Опубликовано 4 апреля 2026

Как языковые модели ускоряют запросы в базах данных

Когда база данных «думает»: как языковые модели ускоряют запросы

Исследователи выяснили, что языковые модели способны оптимизировать выполнение запросов к базам данных и делают это значительно эффективнее привычных статистических методов.

Исследования 4 – 5 минут чтения
Источник события: Together.ai 4 – 5 минут чтения

Базы данных – система незаметная, но важная. Каждый раз, когда вы что-то ищете в приложении, оформляете заказ или просто открываете ленту, где-то в фоне выполняется запрос к базе данных. Скорость обработки этого запроса определяет многое: быстродействие ответа, нагрузку на серверы, стоимость инфраструктуры.

Звучит технически, но суть проста: базы данных постоянно принимают решения о том, как именно выполнять тот или иной запрос. И принимают их не всегда оптимально. Новое исследование предлагает передать часть этих решений языковым моделям, и результаты оказались неожиданно убедительными.

Почему запросы к базам данных бывают медленными

Откуда берётся медленный запрос

Когда система управления базой данных получает запрос, она не просто выполняет его напрямую. Сначала она строит так называемый план выполнения – последовательность шагов, которая должна привести к нужному результату с наименьшими затратами. Выбор плана – это целая внутренняя оптимизация: как соединять таблицы, в каком порядке обрабатывать данные, где использовать индексы.

Ключевой момент в этом процессе – оценка количества строк, которые вернёт каждый промежуточный шаг. Проще говоря, система пытается предугадать: «если я применю вот это условие, сколько записей останется?» Это называется оценкой кардинальности. И именно здесь часто возникают проблемы.

Классические методы оценки опираются на статистику: гистограммы, выборки, усреднённые показатели. Они хорошо работают в простых случаях, но дают сбой, когда запрос сложный – например, когда нужно соединить несколько таблиц с неочевидными условиями. В таких ситуациях ошибки в оценке кардинальности приводят к тому, что система выбирает неоптимальный план. И запрос, который мог выполниться за секунду, обрабатывается несколько минут.

Языковая модель как оптимизатор запросов

Языковая модель как планировщик запросов

Исследователи задались вопросом: а что если использовать большую языковую модель, чтобы она анализировала запрос и предлагала лучший план выполнения?

На первый взгляд это звучит необычно. Языковые модели обычно работают с текстом – они пишут, переводят, отвечают на вопросы. Причём тут базы данных?

Но если задуматься, SQL-запрос – это тоже текст, причём структурированный. И у языковой модели, обученной на огромных объёмах данных, включая документацию, код и описания схем баз данных, есть шанс «понять» контекст запроса лучше, чем это делают статистические эвристики.

Именно это и проверялось в исследовании. Модель получала на вход SQL-запрос и информацию о структуре базы данных, а на выходе должна была предложить подсказки для планировщика – в частности, скорректированные оценки кардинальности. Эти подсказки затем передавались обратно в систему управления базой данных, которая уже строила план с учётом новой информации.

- Итоги применения языковых моделей для оптимизации

Что показали эксперименты

Для тестирования использовался стандартный отраслевой бенчмарк (эталонный тест) – набор аналитических запросов, который широко применяется для оценки производительности баз данных. Это не синтетические примеры из учебника, а достаточно реалистичные сценарии с множеством соединений таблиц и сложными условиями фильтрации.

Результаты оказались впечатляющими. В ряде случаев запросы выполнялись в 4,78 раза быстрее, чем без вмешательства модели. Это не единичный пример – ускорение наблюдалось на множестве запросов, где стандартный планировщик ошибался в оценках.

При этом подход не требовал переписывать базу данных или менять её архитектуру. Языковая модель работала как внешний советник: она анализировала запрос, давала рекомендации, а дальше всё происходило внутри привычной системы.

Ограничения использования ИИ в оптимизации запросов

Почему это не так просто, как кажется

Конечно, есть и ограничения, и о них важно говорить честно.

Во-первых, языковая модель может ошибаться. Если её оценки окажутся хуже стандартных, план выполнения станет только медленнее. Это означает, что такой подход требует аккуратной интеграции: либо с механизмом проверки, либо с возможностью откатиться к исходному плану.

Во-вторых, вызов языковой модели – это дополнительное время. Для аналитических запросов, которые и без того выполняются долго, небольшая задержка на «консультацию» с моделью может быть оправданна. Но для коротких запросов, которые должны выполняться за миллисекунды, это может быть неприемлемо.

В-третьих, модели нужно понимать схему конкретной базы данных. В экспериментах эта информация передавалась явно, но в реальных промышленных системах схемы бывают огромными и постоянно меняются – это отдельная инженерная задача.

ИИ в инфраструктуре: от научного поиска до реальных решений

ИИ внутри инфраструктуры – не фантастика

Это исследование вписывается в более широкую тенденцию: языковые модели начинают применяться не только как интерфейс для пользователя, но и как компонент внутри технических систем – там, где раньше правили строгие алгоритмы и статистика.

Оптимизация баз данных – сложная область, которая десятилетиями развивалась своим путём. То, что языковая модель способна внести в неё измеримый вклад без специализированного дообучения под конкретную задачу, – это само по себе любопытный результат.

Пока это скорее доказательство концепции, чем готовое производственное решение. Но направление обозначено чётко: ИИ постепенно проникает в слои инфраструктуры, которые раньше казались далёкими от машинного обучения. И судя по результатам, иногда это действительно помогает работать быстрее.

Оригинальное название: AI for Systems: Using LLMs to Optimize Database Query Execution
Дата публикации: 3 апр 2026
Together.ai www.together.ai Американская платформа для запуска и масштабирования открытых ИИ-моделей.
Предыдущая статья Как обучают большие языковые модели: что скрывается за масштабированием Следующая статья Wan 2.7: новый набор ИИ-инструментов для работы с видео

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Alibaba Cloud представила DAS Agent – ИИ-инструмент для управления базами данных одновременно в нескольких облаках и системах через обычный диалог на естественном языке.

Alibaba Cloudwww.alibabacloud.com 30 мар 2026

NVIDIA и LMSYS протестировали модель DeepSeek на новейшем ускорителе GB300. Результаты показали заметное улучшение по сравнению с предыдущим поколением.

LMSYS ORGlmsys.org 21 фев 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться