Опубликовано 1 апреля 2026

Red Hat AI: результаты в MLPerf Inference v6.0 на открытом стеке

Red Hat AI показала лучшие результаты в MLPerf Inference v6.0 – и вот что за этим стоит

Red Hat AI заняла первые места в свежем раунде бенчмарка MLPerf Inference v6.0, протестировав сразу три модели на видеокартах NVIDIA и AMD.

Инфраструктура 4 – 5 минут чтения
Источник события: Red Hat 4 – 5 минут чтения

Существует отраслевой тест для ИИ-систем – MLPerf Inference. Если коротко, это своего рода официальный зачёт: компании берут реальные модели, запускают их на своём оборудовании и публикуют результаты в открытом виде. Никаких закрытых демонстраций – только цифры, которые можно сравнить. Раунды проходят несколько раз в год, и каждый новый выпуск показывает прогресс индустрии.

В шестом раунде – MLPerf Inference v6.0 – Red Hat AI заняла первые строчки сразу в нескольких категориях. Это само по себе примечательно, потому что обычно в лидерах находятся производители оборудования. Здесь же на первый план вышла компания, которая делает ставку на программный стек и открытые инструменты.

Три модели, три примера решений

Три модели, три истории

Red Hat AI тестировала сразу три модели, причём разного профиля.

Первая – Whisper. Это модель для распознавания речи: она переводит аудио в текст. Задача кажется простой, но на практике требует быстрой обработки потока данных, особенно если запросы поступают непрерывно. Именно в этой категории Red Hat показала один из лучших результатов.

Вторая – Qwen3-VL. Это мультимодальная модель: она умеет работать одновременно не только с текстом, но и с изображениями. Проще говоря, можно показать ей картинку и задать вопрос – она поймёт и то, и другое. Такие модели сложнее в обслуживании, потому что им нужно согласованно обрабатывать разные типы данных.

Третья – GPT-OSS-120B. Это крупная языковая модель с открытыми весами на 120 миллиардов параметров. Чем больше параметров – тем выше требования к памяти и скорости. Удержать такую модель в приемлемых рамках по задержке и пропускной способности – нетривиальная инженерная задача.

Преимущества универсального подхода в ИИ

Почему это не просто «хорошие показатели»

Разные участники MLPerf часто оптимизируют под конкретный тест: берут одну модель, одно оборудование, один сценарий – и выжимают максимум именно там. Red Hat пошла немного другим путём: три разные модели, два разных производителя GPU – NVIDIA и AMD – и при этом единый программный подход.

Это важно, потому что в реальных развёртываниях компании редко функционируют в идеально однородной инфраструктуре. Кто-то использует NVIDIA, кто-то начинает рассматривать AMD как альтернативу. Если ваш инструментарий нормально работает на обоих – это уже практическое преимущество, а не только строчка в пресс-релизе.

Технологии Red Hat AI в MLPerf Inference v6.0

Как это работало под капотом – ровно столько, сколько нужно знать

Red Hat AI использовала vLLM – это движок для запуска больших языковых моделей, оптимизированный под высокую пропускную способность. Он умеет эффективно распределять память и обрабатывать множество запросов параллельно, не теряя в скорости.

Помимо этого, применялся llm-d – распределённый планировщик запросов, который позволяет масштабировать инференс горизонтально: проще говоря, распределять нагрузку по нескольким узлам без ручной настройки каждого из них.

Всё это работало поверх OpenShift AI – платформы для запуска ИИ-задач в корпоративных средах. Её роль здесь – не столько само по себе ускорение, сколько возможность воспроизводимо и управляемо разворачивать такие системы в реальных условиях, а не только в лабораторных.

Проще говоря: команда не изобретала специализированные решения ради красивых цифр в бенчмарке – она использовала тот же стек, который применяется в реальных продуктах. Это несколько меняет смысл результата: это не «синтетический рекорд», а демонстрация того, что работающие инструменты действительно конкурентоспособны.

Открытые решения как стратегия в ИИ

Открытость как стратегия

Отдельный момент, который стоит отметить: все компоненты, использованные Red Hat, – открытые. vLLM, llm-d, модели – это не проприетарные разработки, закрытые внутри компании. Участие в MLPerf с открытым стеком – это и демонстрация возможностей, и своего рода аргумент в пользу того, что open source в ИИ-инфраструктуре перестал быть «бюджетным вариантом».

Для индустрии это не мелочь. Долгое время негласным стандартом было: хочешь лучшую производительность – используй закрытые решения, оптимизированные под конкретное оборудование. Результаты вроде этого постепенно размывают эту границу.

MLPerf Inference: что тест не учитывает

Что остаётся за кадром

MLPerf – хороший ориентир, но не абсолютная истина. Тест измеряет производительность в строго определённых условиях: конкретные модели, конкретные сценарии нагрузки, конкретные метрики. В реальных системах условия всегда другие – другие запросы, другие профили использования, другие ограничения.

Кроме того, оптимизация под бенчмарк и оптимизация под продакшн – не одно и то же. Команды, участвующие в MLPerf, знают правила игры и готовятся к ним. Насколько те же результаты воспроизводятся в «дикой природе» – отдельный вопрос, на который ни один тест не даёт окончательного ответа.

Тем не менее MLPerf остаётся одним из немногих мест, где можно честно сравнить подходы в более-менее контролируемых условиях. И появление там Red Hat AI с открытым стеком на нескольких моделях и двух платформах GPU – это как минимум сигнал, что направление выбрано не случайно.

Оригинальное название: Red Hat AI tops MLPerf Inference v6.0 with vLLM on Qwen3-VL, Whisper, and GPT-OSS-120B
Дата публикации: 1 апр 2026
Red Hat www.redhat.com Международная компания, развивающая открытые программные платформы и инфраструктурные решения с поддержкой ИИ.
Предыдущая статья Управление ИИ: почему правила без адаптации превращаются в список обходных путей Следующая статья AMD на MLPerf Inference 6.0: миллион токенов в секунду и первый выход в видеогенерацию

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

AMD рассказала о прогрессе в поддержке ИИ-моделей на своих GPU: от базовой совместимости до оптимизированной производительности, сопоставимой с конкурентами.

AMDwww.amd.com 18 фев 2026

AMD адаптировала фреймворк Miles для крупномасштабного обучения с подкреплением на GPU Instinct – теперь это работает и без оборудования NVIDIA.

LMSYS ORGlmsys.org 24 мар 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться