Когда речь заходит об ИИ-инфраструктуре для бизнеса, перед разработчиками давно встает нехитрая, но неприятная проблема: либо ты работаешь внутри одной большой платформы и пользуешься её инструментами, либо берешь что-то извне – и тогда начинается «лоскутное одеяло» из разных сервисов, учетных записей и точек входа. Microsoft явно решила с этим разобраться.
Что случилось
Microsoft объявила о публичном превью Fireworks AI на платформе Microsoft Foundry. Если коротко: теперь пользователи Azure могут запускать популярные открытые ИИ-модели через инфраструктуру Fireworks AI прямо из своего Foundry-проекта, не выходя за пределы привычной среды Azure.
Fireworks AI – это компания, специализирующаяся на высокоскоростном запуске открытых моделей. Их конёк – минимальные задержки и высокая пропускная способность. Говоря проще: модели через Fireworks отвечают быстро и не «зависают» под нагрузкой.
Зачем это нужно и кому
Открытые модели – то есть модели, веса которых публично доступны и которые можно дообучать под свои задачи, – становятся всё популярнее в бизнес-среде. Причины понятны: больше контроля над поведением алгоритмов, возможность адаптировать их под конкретную область и отсутствие жесткой привязки к одному вендору.
Но у этого подхода есть своя цена. Чтобы запустить такую модель в реальном продукте, нужно где-то её разместить, обеспечить нормальную скорость, выстроить мониторинг и соблюсти корпоративные требования к безопасности. Именно здесь раньше начинался хаос: команды собирали собственные цепочки из разных инструментов, и масштабировать их было непросто.
Интеграция Fireworks AI в Microsoft Foundry закрывает этот пробел. Теперь и высокоскоростной инференс, и инструменты управления, и оценка безопасности доступны в одном месте.
Что конкретно доступно с запуском
На старте в каталоге появились четыре модели: MiniMax M2.5 (новинка), OpenAI gpt-oss-120b, Kimi-K2.5 от MoonshotAI и DeepSeek-v3.2. Список будет пополняться по мере того, как исследовательские лаборатории будут выпускать новые решения.
Для тех, кто уже дообучал модели под свои задачи, предусмотрена отдельная возможность – bring-your-own-weights (использование собственных весов). Можно загрузить свою версию модели и развернуть её в продакшене через Foundry. Поддерживаются дообученные варианты на основе Qwen3-14B, gpt-oss-120b, Kimi K2 и K2.5, DeepSeek v3.1 и v3.2.
Доступны два варианта использования. Первый – serverless (бессерверный): вы платите за каждый обработанный токен. Это удобно для экспериментов и непредсказуемых нагрузок. Второй – выделенная пропускная способность (provisioned throughput): вы резервируете ресурсы заранее и получаете гарантированную скорость отклика. Данный вариант подходит для стабильных нагрузок в продакшене, когда важна предсказуемость, а не гибкость.
Для бессерверного варианта пока доступны регионы в США: East US, East US 2, Central US, North Central US, West US и West US 3. Квота на токены назначается автоматически в зависимости от типа подписки Azure.
Безопасность и управление
Один из вопросов, возникающих сразу: а что с контролем над тем, какой контент генерируют эти модели? Foundry предоставляет встроенные инструменты оценки рисков и безопасности – это позволяет проверять поведение модели, не выстраивая для этих целей отдельный технологический стек.
Важный момент: модели через Fireworks не проходят те же автоматические проверки, что и «родные» модели Azure. Для последних Microsoft проводит собственные оценки по стандартам ответственного ИИ. Fireworks-модели в эту категорию не входят – их безопасность нужно оценивать самостоятельно, используя инструменты Foundry.
Публичное превью: текущие ограничения
Функция сейчас находится в стадии публичного превью. Чтобы её включить, необходимо явно активировать соответствующую опцию в настройках Azure-подписки через панель предварительных функций – автоматически она не подключается.
Если какая-то из моделей перестанет поддерживаться, пользователи получат уведомление минимум за 30 дней. Это стандартная практика для подобных платформ, и хорошо, что она прямо прописана в условиях.
Что это говорит о развитии Foundry
Если смотреть шире, интеграция Fireworks – это часть масштабного вектора развития. Microsoft Foundry движется в сторону единого пространства, где можно не просто запустить модель, но и оценить её, дообучить, развернуть, отслеживать её работу и в любой момент заменить. Открытые модели становятся частью этой экосистемы наравне с проприетарными, что меняет расклад для команд, которые ценят гибкость, но не готовы строить собственную инфраструктуру с нуля.