Среди людей, которые работают с данными – аналитиков, дата-инженеров, разработчиков баз данных – существует барьер на пути к ИИ. Это не нехватка интереса, а нехватка инструментов на их «родном» языке. Чтобы подключить языковую модель к своей задаче, им обычно приходится либо осваивать Python, либо ждать, пока коллеги из ML-команды напишут нужный пайплайн, что медленно и неудобно.
Alibaba Cloud предложила другой подход: что, если языковую модель можно вызывать прямо из SQL-запроса – так же буднично, как обращаться к таблице с данными?
Компания объединила возможности двух своих продуктов: аналитической базы данных Hologres и платформы для работы с ИИ-моделями Model Studio. В результате дата-разработчики получили возможность вызывать большие языковые модели (LLM) напрямую из SQL – без Python, без отдельной инфраструктуры и без необходимости разбираться в том, как устроены сами модели.
Проще говоря: пишешь SQL-запрос, в нём обращаешься к модели, передаёшь ей текст или изображение – и получаешь ответ в виде данных, с которыми можно работать дальше.
SQL – это язык, который знают практически все, кто работает с данными. Он существует десятилетиями, понятен, предсказуем и встроен в привычные рабочие процессы. Огромное количество аналитических систем и пайплайнов построено именно на нём.
Когда возможности ИИ становятся доступны через этот же язык, не нужно менять стек технологий, переучиваться или ждать помощи от другой команды. Дата-инженер может сразу включить языковую модель в существующий процесс обработки данных – как ещё одну функцию в запросе.
Это особенно актуально для команд, у которых нет выделенных ML-специалистов или GPU-инфраструктуры. Вся вычислительная нагрузка остаётся на стороне Model Studio – пользователю не нужно об этом думать.
Интеграция открывает несколько сценариев, которые раньше требовали отдельных инструментов и компетенций.
Анализ PDF-документов. Можно передать языковой модели содержимое документа в SQL-запросе и попросить извлечь из него нужную информацию: суммировать, найти конкретные данные, классифицировать. Это удобно, например, при работе с договорами, отчётами или техническими спецификациями, которые хранятся в базе данных.
Понимание изображений. Модели, умеющие работать не только с текстом, но и с картинками, также доступны через SQL. Это означает, что можно, например, автоматически описывать изображения в таблице или извлекать из них структурированные данные – всё в рамках одного запроса.
RAG – поиск с опорой на собственные данные. Один из популярных подходов в корпоративном ИИ – это так называемый RAG (retrieval-augmented generation), или генерация с дополненной выборкой: модель отвечает на вопросы, опираясь не только на то, чему её обучили, но и на конкретные документы или базы знаний компании. Реализовать такой сценарий теперь можно средствами SQL, без построения отдельной архитектуры.
Почему это не так просто, как кажется
На первый взгляд это выглядит как «синтаксический сахар»: вызов модели обёрнут в привычный запрос. Но за этим стоит более серьёзная задача интеграции.
Hologres должна уметь правильно передавать данные в Model Studio, получать ответы, обрабатывать ошибки и встраивать всё это в транзакционную логику базы данных. По сути, граница между аналитической системой и ИИ-платформой становится прозрачной – и это требует плотной интеграции на уровне архитектуры, а не просто «обёртки» над API.
Для конечного пользователя это остаётся невидимым. Но именно эта невидимость и является ценностью: разработчику не нужно думать о том, что происходит «под капотом».
Решение ориентировано на экосистему Alibaba Cloud. Если команда уже работает с Hologres и Model Studio, интеграция выглядит органично. Если нет, то переход потребует осмысленного решения о смене или расширении инфраструктуры.
Кроме того, качество результатов по-прежнему зависит от того, насколько хорошо сформулированы запросы к модели. SQL упрощает доступ, но не отменяет необходимости понимать, что именно вы запрашиваете у модели и в каком формате ожидаете ответ. Проще говоря, «спросить по-SQL» – это не то же самое, что «спросить правильно».
Этот шаг вписывается в более широкую тенденцию: ИИ-возможности всё активнее встраиваются в инструменты, которые уже используются в работе, – а не существуют отдельно, требуя специальных знаний для доступа к ним.
Базы данных, редакторы кода, таблицы, системы управления задачами – всё это постепенно становится точками входа в ИИ. Не потому что так «красивее» выглядит в презентации, а потому что именно там люди проводят рабочее время.
Возможность вызвать языковую модель из SQL – это небольшой, но показательный пример того, как снижается порог входа. Не для всех сразу и не для любых задач. Но для конкретной аудитории – дата-инженеров и аналитиков – это ощутимый сдвиг в том, что становится доступным без дополнительных усилий.