Опубликовано 22 марта 2026

coSTAR: методология Databricks для разработки ИИ-агентов

coSTAR: как в Databricks быстро и без поломок запускают ИИ-агентов

Databricks разработала собственный подход к созданию ИИ-агентов – систему coSTAR, которая позволяет команде работать быстро, не теряя контроль над качеством.

Разработка 5 – 7 минут чтения

Источник события: Databricks 5 – 7 минут чтения

Представьте: вы даёте помощнику по коду задание – переписать большой фрагмент проекта, но при этом у вас нет никаких тестов, никакой проверки, никакой возможности понять, что именно изменилось и не сломалось ли что-то важное. Звучит рискованно, правда? Примерно в такой ситуации оказываются команды, которые разрабатывают ИИ-агентов без нормальной методологии: движутся быстро, но без страховки.

Именно с этой проблемой столкнулись в Databricks. Компания занимается платформами для работы с данными и активно создаёт собственных ИИ-агентов. В какой-то момент стало понятно: просто писать агентов и запускать их в продакшн недостаточно. Нужен системный подход, который позволит и двигаться быстро, и не терять контроль над тем, что что-то незаметно перестало работать.

Так появился coSTAR.

Что такое coSTAR и зачем он нужен

coSTAR – это внутренняя методология Databricks для разработки и внедрения ИИ-агентов. Это не библиотека, не фреймворк в привычном смысле, а скорее набор принципов и практик, который отвечает на вопрос: как правильно строить агентов, чтобы потом не было мучительно больно?

Проще говоря, это попытка навести порядок в том, что по своей природе очень трудно поддаётся контролю. ИИ-агенты – это не статичные программы. Они принимают решения, вызывают инструменты, взаимодействуют с внешними системами. Один и тот же агент может вести себя по-разному в зависимости от контекста, формулировки запроса или состояния модели. Это делает их разработку принципиально отличной от обычного программирования.

В традиционной разработке программного обеспечения есть понятная логика: написал код – запустил тест – увидел результат. С агентами так не работает. Тест может пройти, но агент всё равно сделает что-то неожиданное в реальных условиях. Именно поэтому нужен не просто набор тестов, а целая культура работы с такими системами.

Из чего состоит подход coSTAR

Из чего состоит подход

Название coSTAR – это аббревиатура, за каждой буквой которой стоит конкретный принцип.

Контекст (Context) – агент должен чётко понимать, в какой среде он работает, какие у него задачи и ограничения. Это звучит очевидно, но на практике именно размытый контекст становится причиной большинства странных ошибок.

Цель (Objective) – у агента должна быть явно сформулированная цель. Не размытое «помоги пользователю», а конкретный результат, который можно измерить и оценить.

Шаги (Steps) – декомпозиция задачи на понятные этапы. Агент не должен пытаться решить всё одним большим шагом – лучше разбить работу на управляемые части.

Тональность (Tone) – то, как агент общается с пользователем: стиль, уровень формальности, манера объяснять. Это влияет не только на восприятие, но и на доверие к системе.

Аудитория (Audience) – агент должен понимать, для кого он работает. Ответ для опытного разработчика и для новичка – это принципиально разные ответы, даже если вопрос одинаковый.

Ответ (Response) – финальный блок, который описывает, как должен выглядеть результат: формат, структура, уровень детализации.

По сути, coSTAR – это способ системно, а не интуитивно, думать о промптах и поведении агента. Вместо того чтобы каждый раз заново угадывать, как правильно сформулировать задачу для агента, команда работает с единой структурой.

Как совместить скорость и надёжность в разработке ИИ-агентов

Быстро и надёжно – можно ли совместить?

Один из главных вопросов в разработке агентов – это вечное противоречие между скоростью и стабильностью. Если двигаться быстро, что-то обязательно сломается. Если делать всё медленно и осторожно, конкуренты уйдут вперёд.

В Databricks считают, что правильная методология снимает это противоречие или как минимум сильно смягчает его. Когда у команды есть общий язык, общая структура и понятные критерии оценки, каждое изменение становится предсказуемее. Не нужно каждый раз заново договариваться о том, что считать хорошим результатом.

Это особенно важно в контексте итеративной разработки. Агенты постоянно меняются: обновляются модели, добавляются новые инструменты, меняются требования пользователей. Без чёткой системы оценки каждое такое обновление – это лотерея. С coSTAR – это управляемый процесс с понятными точками контроля.

Особенности оценки качества ИИ-агентов

Оценка – самое сложное

Отдельного внимания заслуживает то, как в Databricks подходят к оценке качества агентов. Это, пожалуй, самая нетривиальная часть всей методологии.

С обычным кодом всё относительно просто: тест либо проходит, либо нет. С агентом так не работает. Агент может дать технически правильный ответ, но совершенно бесполезный в данном контексте. Или сделать всё по шагам верно, но прийти к странному выводу. Или отлично работать на тестовых примерах и непредсказуемо – на реальных запросах.

Поэтому в coSTAR оценка строится на нескольких уровнях одновременно. Есть автоматические проверки – они быстрые и позволяют отловить очевидные регрессии. Есть оценка с помощью другой языковой модели – она медленнее, но улавливает смысловые ошибки, которые автоматика пропускает. И есть оценка людьми – самая дорогая, но необходимая для финального контроля качества.

Такой многоуровневый подход позволяет не выбирать между скоростью и точностью, а комбинировать их: быстрые проверки – на каждом шаге, более глубокие – там, где это действительно нужно.

Применимость методологии coSTAR за пределами Databricks

Почему это не только о Databricks

Databricks публично описала свой подход не для того, чтобы похвастаться, а скорее потому, что проблема универсальная. Любая команда, которая серьёзно занимается разработкой ИИ-агентов, рано или поздно сталкивается с теми же вопросами: как оценивать качество, как не сломать то, что уже работает, как двигаться быстро и при этом сохранять контроль.

Готовых ответов на эти вопросы в индустрии пока немного. Большинство команд либо изобретают свои подходы с нуля, либо работают интуитивно – и периодически наступают на одни и те же грабли. Появление таких публичных методологий, как coSTAR, – это попытка нарастить общий уровень зрелости в области разработки агентов.

Это не значит, что coSTAR – универсальный рецепт. Он отражает конкретный опыт конкретной команды в конкретных условиях. Но сама логика – сначала договориться об общей структуре, потом двигаться быстро – применима гораздо шире, чем один отдельный продукт или компания.

Какие вопросы остаются открытыми в методологии coSTAR

Что остаётся открытым

При всей стройности подхода, честно говоря, вопросы остаются. Насколько хорошо coSTAR масштабируется на действительно сложные многоагентные системы? Как он работает, когда агентов становится много и они взаимодействуют друг с другом? Насколько применим этот подход в командах, которые не имеют такой же глубокой экспертизы в области данных и ИИ, как Databricks?

Ответов на эти вопросы в публичном описании нет – и это нормально. Методология живая, она продолжает развиваться вместе с практикой. Агентные системы – это ещё молодая область, и даже у тех, кто занимается ею вплотную, многое остаётся в стадии экспериментов.

Но сам факт того, что компании начинают систематизировать и публично описывать свой опыт, – это хороший знак. Значит, область взрослеет. И следующий агент, которого вы запустите в продакшн, с чуть большей вероятностью будет вести себя так, как вы от него ожидаете. 🙂

#прикладной разбор #методология #развитие ии #обучение ии #инженерия #масштабирование #генеративные агенты #бенчмаркинг агентов

Ссылка на публикацию: https://www.databricks.com/blog/costar-how-we-ship-ai-agents-databricks-fast-without-breaking-things

Оригинальное название: coSTAR: How We Ship AI Agents at Databricks Fast, Without Breaking Things

Дата публикации: 21 мар 2026

Databricks www.databricks.com Американская платформа для анализа данных и машинного обучения на базе Lakehouse-архитектуры.

Предыдущая статья PyTorch 2.10 и TorchAO: как ИИ на вашем ноутбуке стал реальнее Следующая статья Обучение топовых ИИ-моделей: дешевле, чем принято считать

coSTAR: методология Databricks для разработки ИИ-агентов

Что такое coSTAR и зачем он нужен

Из чего состоит подход coSTAR

Как совместить скорость и надёжность в разработке ИИ-агентов

Особенности оценки качества ИИ-агентов

Применимость методологии coSTAR за пределами Databricks

Какие вопросы остаются открытыми в методологии coSTAR

Связанные публикации

Как понять, что ваш ИИ-агент работает правильно, а не просто выглядит убедительно

Тест-драйв ИИ-агентов: проверка в реальных условиях, а не на игрушечных задачах

Как Cursor оценивает качество ИИ-моделей в своём редакторе

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации