Опубликовано 11 марта 2026

Fireworks AI появился в Microsoft Foundry: быстрые открытые модели теперь внутри Azure

Microsoft и Fireworks AI объединились, чтобы предоставить разработчикам доступ к быстрым открытым моделям прямо из экосистемы Azure – без лишних посредников и инфраструктурной головной боли.

Инфраструктура 3 – 5 минут чтения
Источник события: Microsoft 3 – 5 минут чтения

Когда речь заходит об ИИ-инфраструктуре для бизнеса, перед разработчиками давно встает нехитрая, но неприятная проблема: либо ты работаешь внутри одной большой платформы и пользуешься её инструментами, либо берешь что-то извне – и тогда начинается «лоскутное одеяло» из разных сервисов, учетных записей и точек входа. Microsoft явно решила с этим разобраться.

Интеграция Fireworks AI и Microsoft Azure Foundry

Что случилось

Microsoft объявила о публичном превью Fireworks AI на платформе Microsoft Foundry. Если коротко: теперь пользователи Azure могут запускать популярные открытые ИИ-модели через инфраструктуру Fireworks AI прямо из своего Foundry-проекта, не выходя за пределы привычной среды Azure.

Fireworks AI – это компания, специализирующаяся на высокоскоростном запуске открытых моделей. Их конёк – минимальные задержки и высокая пропускная способность. Говоря проще: модели через Fireworks отвечают быстро и не «зависают» под нагрузкой.

Преимущества использования открытых ИИ моделей для бизнеса

Зачем это нужно и кому

Открытые модели – то есть модели, веса которых публично доступны и которые можно дообучать под свои задачи, – становятся всё популярнее в бизнес-среде. Причины понятны: больше контроля над поведением алгоритмов, возможность адаптировать их под конкретную область и отсутствие жесткой привязки к одному вендору.

Но у этого подхода есть своя цена. Чтобы запустить такую модель в реальном продукте, нужно где-то её разместить, обеспечить нормальную скорость, выстроить мониторинг и соблюсти корпоративные требования к безопасности. Именно здесь раньше начинался хаос: команды собирали собственные цепочки из разных инструментов, и масштабировать их было непросто.

Интеграция Fireworks AI в Microsoft Foundry закрывает этот пробел. Теперь и высокоскоростной инференс, и инструменты управления, и оценка безопасности доступны в одном месте.

Список доступных моделей и поддержка собственных весов

Что конкретно доступно с запуском

На старте в каталоге появились четыре модели: MiniMax M2.5 (новинка), OpenAI gpt-oss-120b, Kimi-K2.5 от MoonshotAI и DeepSeek-v3.2. Список будет пополняться по мере того, как исследовательские лаборатории будут выпускать новые решения.

Для тех, кто уже дообучал модели под свои задачи, предусмотрена отдельная возможность – bring-your-own-weights (использование собственных весов). Можно загрузить свою версию модели и развернуть её в продакшене через Foundry. Поддерживаются дообученные варианты на основе Qwen3-14B, gpt-oss-120b, Kimi K2 и K2.5, DeepSeek v3.1 и v3.2.

Две модели оплаты: плата за токены или резервирование мощности

Доступны два варианта использования. Первый – serverless (бессерверный): вы платите за каждый обработанный токен. Это удобно для экспериментов и непредсказуемых нагрузок. Второй – выделенная пропускная способность (provisioned throughput): вы резервируете ресурсы заранее и получаете гарантированную скорость отклика. Данный вариант подходит для стабильных нагрузок в продакшене, когда важна предсказуемость, а не гибкость.

Для бессерверного варианта пока доступны регионы в США: East US, East US 2, Central US, North Central US, West US и West US 3. Квота на токены назначается автоматически в зависимости от типа подписки Azure.

Инструменты оценки рисков и контроля контента в Foundry

Безопасность и управление

Один из вопросов, возникающих сразу: а что с контролем над тем, какой контент генерируют эти модели? Foundry предоставляет встроенные инструменты оценки рисков и безопасности – это позволяет проверять поведение модели, не выстраивая для этих целей отдельный технологический стек.

Важный момент: модели через Fireworks не проходят те же автоматические проверки, что и «родные» модели Azure. Для последних Microsoft проводит собственные оценки по стандартам ответственного ИИ. Fireworks-модели в эту категорию не входят – их безопасность нужно оценивать самостоятельно, используя инструменты Foundry.

Условия использования и активация функций в режиме превью

Публичное превью: текущие ограничения

Функция сейчас находится в стадии публичного превью. Чтобы её включить, необходимо явно активировать соответствующую опцию в настройках Azure-подписки через панель предварительных функций – автоматически она не подключается.

Если какая-то из моделей перестанет поддерживаться, пользователи получат уведомление минимум за 30 дней. Это стандартная практика для подобных платформ, и хорошо, что она прямо прописана в условиях.

Перспективы развития экосистемы Microsoft Foundry

Что это говорит о развитии Foundry

Если смотреть шире, интеграция Fireworks – это часть масштабного вектора развития. Microsoft Foundry движется в сторону единого пространства, где можно не просто запустить модель, но и оценить её, дообучить, развернуть, отслеживать её работу и в любой момент заменить. Открытые модели становятся частью этой экосистемы наравне с проприетарными, что меняет расклад для команд, которые ценят гибкость, но не готовы строить собственную инфраструктуру с нуля.

Оригинальное название: Introducing Fireworks AI on Microsoft Foundry: Bringing high performance, low latency open model inference to Azure
Дата публикации: 11 мар 2026
Microsoft www.microsoft.com Международная компания, интегрирующая ИИ в облако, офисные продукты и инструменты разработчиков.
Предыдущая статья Moondream научилась выделять объекты на фото точнее и на 40% быстрее Следующая статья Anthropic запускает институт для изучения последствий создания мощного ИИ

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 3 Flash Preview Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 3 Flash Preview Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться