Опубликовано 22 марта 2026

coSTAR: методология Databricks для разработки ИИ-агентов

coSTAR: как в Databricks быстро и без поломок запускают ИИ-агентов

Databricks разработала собственный подход к созданию ИИ-агентов – систему coSTAR, которая позволяет команде работать быстро, не теряя контроль над качеством.

Разработка 5 – 7 минут чтения
Источник события: Databricks 5 – 7 минут чтения

Представьте: вы даёте помощнику по коду задание – переписать большой фрагмент проекта, но при этом у вас нет никаких тестов, никакой проверки, никакой возможности понять, что именно изменилось и не сломалось ли что-то важное. Звучит рискованно, правда? Примерно в такой ситуации оказываются команды, которые разрабатывают ИИ-агентов без нормальной методологии: движутся быстро, но без страховки.

Именно с этой проблемой столкнулись в Databricks. Компания занимается платформами для работы с данными и активно создаёт собственных ИИ-агентов. В какой-то момент стало понятно: просто писать агентов и запускать их в продакшн недостаточно. Нужен системный подход, который позволит и двигаться быстро, и не терять контроль над тем, что что-то незаметно перестало работать.

Так появился coSTAR.

Что такое coSTAR и зачем он нужен

coSTAR – это внутренняя методология Databricks для разработки и внедрения ИИ-агентов. Это не библиотека, не фреймворк в привычном смысле, а скорее набор принципов и практик, который отвечает на вопрос: как правильно строить агентов, чтобы потом не было мучительно больно?

Проще говоря, это попытка навести порядок в том, что по своей природе очень трудно поддаётся контролю. ИИ-агенты – это не статичные программы. Они принимают решения, вызывают инструменты, взаимодействуют с внешними системами. Один и тот же агент может вести себя по-разному в зависимости от контекста, формулировки запроса или состояния модели. Это делает их разработку принципиально отличной от обычного программирования.

В традиционной разработке программного обеспечения есть понятная логика: написал код – запустил тест – увидел результат. С агентами так не работает. Тест может пройти, но агент всё равно сделает что-то неожиданное в реальных условиях. Именно поэтому нужен не просто набор тестов, а целая культура работы с такими системами.

Из чего состоит подход coSTAR

Из чего состоит подход

Название coSTAR – это аббревиатура, за каждой буквой которой стоит конкретный принцип.

Контекст (Context) – агент должен чётко понимать, в какой среде он работает, какие у него задачи и ограничения. Это звучит очевидно, но на практике именно размытый контекст становится причиной большинства странных ошибок.

Цель (Objective) – у агента должна быть явно сформулированная цель. Не размытое «помоги пользователю», а конкретный результат, который можно измерить и оценить.

Шаги (Steps) – декомпозиция задачи на понятные этапы. Агент не должен пытаться решить всё одним большим шагом – лучше разбить работу на управляемые части.

Тональность (Tone) – то, как агент общается с пользователем: стиль, уровень формальности, манера объяснять. Это влияет не только на восприятие, но и на доверие к системе.

Аудитория (Audience) – агент должен понимать, для кого он работает. Ответ для опытного разработчика и для новичка – это принципиально разные ответы, даже если вопрос одинаковый.

Ответ (Response) – финальный блок, который описывает, как должен выглядеть результат: формат, структура, уровень детализации.

По сути, coSTAR – это способ системно, а не интуитивно, думать о промптах и поведении агента. Вместо того чтобы каждый раз заново угадывать, как правильно сформулировать задачу для агента, команда работает с единой структурой.

Как совместить скорость и надёжность в разработке ИИ-агентов

Быстро и надёжно – можно ли совместить?

Один из главных вопросов в разработке агентов – это вечное противоречие между скоростью и стабильностью. Если двигаться быстро, что-то обязательно сломается. Если делать всё медленно и осторожно, конкуренты уйдут вперёд.

В Databricks считают, что правильная методология снимает это противоречие или как минимум сильно смягчает его. Когда у команды есть общий язык, общая структура и понятные критерии оценки, каждое изменение становится предсказуемее. Не нужно каждый раз заново договариваться о том, что считать хорошим результатом.

Это особенно важно в контексте итеративной разработки. Агенты постоянно меняются: обновляются модели, добавляются новые инструменты, меняются требования пользователей. Без чёткой системы оценки каждое такое обновление – это лотерея. С coSTAR – это управляемый процесс с понятными точками контроля.

Особенности оценки качества ИИ-агентов

Оценка – самое сложное

Отдельного внимания заслуживает то, как в Databricks подходят к оценке качества агентов. Это, пожалуй, самая нетривиальная часть всей методологии.

С обычным кодом всё относительно просто: тест либо проходит, либо нет. С агентом так не работает. Агент может дать технически правильный ответ, но совершенно бесполезный в данном контексте. Или сделать всё по шагам верно, но прийти к странному выводу. Или отлично работать на тестовых примерах и непредсказуемо – на реальных запросах.

Поэтому в coSTAR оценка строится на нескольких уровнях одновременно. Есть автоматические проверки – они быстрые и позволяют отловить очевидные регрессии. Есть оценка с помощью другой языковой модели – она медленнее, но улавливает смысловые ошибки, которые автоматика пропускает. И есть оценка людьми – самая дорогая, но необходимая для финального контроля качества.

Такой многоуровневый подход позволяет не выбирать между скоростью и точностью, а комбинировать их: быстрые проверки – на каждом шаге, более глубокие – там, где это действительно нужно.

Применимость методологии coSTAR за пределами Databricks

Почему это не только о Databricks

Databricks публично описала свой подход не для того, чтобы похвастаться, а скорее потому, что проблема универсальная. Любая команда, которая серьёзно занимается разработкой ИИ-агентов, рано или поздно сталкивается с теми же вопросами: как оценивать качество, как не сломать то, что уже работает, как двигаться быстро и при этом сохранять контроль.

Готовых ответов на эти вопросы в индустрии пока немного. Большинство команд либо изобретают свои подходы с нуля, либо работают интуитивно – и периодически наступают на одни и те же грабли. Появление таких публичных методологий, как coSTAR, – это попытка нарастить общий уровень зрелости в области разработки агентов.

Это не значит, что coSTAR – универсальный рецепт. Он отражает конкретный опыт конкретной команды в конкретных условиях. Но сама логика – сначала договориться об общей структуре, потом двигаться быстро – применима гораздо шире, чем один отдельный продукт или компания.

Какие вопросы остаются открытыми в методологии coSTAR

Что остаётся открытым

При всей стройности подхода, честно говоря, вопросы остаются. Насколько хорошо coSTAR масштабируется на действительно сложные многоагентные системы? Как он работает, когда агентов становится много и они взаимодействуют друг с другом? Насколько применим этот подход в командах, которые не имеют такой же глубокой экспертизы в области данных и ИИ, как Databricks?

Ответов на эти вопросы в публичном описании нет – и это нормально. Методология живая, она продолжает развиваться вместе с практикой. Агентные системы – это ещё молодая область, и даже у тех, кто занимается ею вплотную, многое остаётся в стадии экспериментов.

Но сам факт того, что компании начинают систематизировать и публично описывать свой опыт, – это хороший знак. Значит, область взрослеет. И следующий агент, которого вы запустите в продакшн, с чуть большей вероятностью будет вести себя так, как вы от него ожидаете. 🙂

Оригинальное название: coSTAR: How We Ship AI Agents at Databricks Fast, Without Breaking Things
Дата публикации: 21 мар 2026
Databricks www.databricks.com Американская платформа для анализа данных и машинного обучения на базе Lakehouse-архитектуры.
Предыдущая статья PyTorch 2.10 и TorchAO: как ИИ на вашем ноутбуке стал реальнее Следующая статья Обучение топовых ИИ-моделей: дешевле, чем принято считать

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Компания LightOn представила оценочную систему NOVA. Рассказываем, как она устроена и почему «субъективного ощущения» недостаточно для проверки ИИ-агентов.

LightOn AIwww.lighton.ai 12 мар 2026

Исследователи Hugging Face продемонстрировали способ проверки способности языковых моделей применять инструменты непосредственно в реальной среде, а не в изолированных условиях.

Hugging Facehuggingface.co 13 фев 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться