Опубликовано 1 апреля 2026

Red Hat AI: результаты в MLPerf Inference v6.0 на открытом стеке

Red Hat AI показала лучшие результаты в MLPerf Inference v6.0 – и вот что за этим стоит

Red Hat AI заняла первые места в свежем раунде бенчмарка MLPerf Inference v6.0, протестировав сразу три модели на видеокартах NVIDIA и AMD.

Инфраструктура 4 – 5 минут чтения
Источник события: Red Hat 4 – 5 минут чтения

Существует отраслевой тест для ИИ-систем – MLPerf Inference. Если коротко, это своего рода официальный зачёт: компании берут реальные модели, запускают их на своём оборудовании и публикуют результаты в открытом виде. Никаких закрытых демонстраций – только цифры, которые можно сравнить. Раунды проходят несколько раз в год, и каждый новый выпуск показывает прогресс индустрии.

В шестом раунде – MLPerf Inference v6.0 – Red Hat AI заняла первые строчки сразу в нескольких категориях. Это само по себе примечательно, потому что обычно в лидерах находятся производители оборудования. Здесь же на первый план вышла компания, которая делает ставку на программный стек и открытые инструменты.

Три модели, три примера решений

Три модели, три истории

Red Hat AI тестировала сразу три модели, причём разного профиля.

Первая – Whisper. Это модель для распознавания речи: она переводит аудио в текст. Задача кажется простой, но на практике требует быстрой обработки потока данных, особенно если запросы поступают непрерывно. Именно в этой категории Red Hat показала один из лучших результатов.

Вторая – Qwen3-VL. Это мультимодальная модель: она умеет работать одновременно не только с текстом, но и с изображениями. Проще говоря, можно показать ей картинку и задать вопрос – она поймёт и то, и другое. Такие модели сложнее в обслуживании, потому что им нужно согласованно обрабатывать разные типы данных.

Третья – GPT-OSS-120B. Это крупная языковая модель с открытыми весами на 120 миллиардов параметров. Чем больше параметров – тем выше требования к памяти и скорости. Удержать такую модель в приемлемых рамках по задержке и пропускной способности – нетривиальная инженерная задача.

Преимущества универсального подхода в ИИ

Почему это не просто «хорошие показатели»

Разные участники MLPerf часто оптимизируют под конкретный тест: берут одну модель, одно оборудование, один сценарий – и выжимают максимум именно там. Red Hat пошла немного другим путём: три разные модели, два разных производителя GPU – NVIDIA и AMD – и при этом единый программный подход.

Это важно, потому что в реальных развёртываниях компании редко функционируют в идеально однородной инфраструктуре. Кто-то использует NVIDIA, кто-то начинает рассматривать AMD как альтернативу. Если ваш инструментарий нормально работает на обоих – это уже практическое преимущество, а не только строчка в пресс-релизе.

Технологии Red Hat AI в MLPerf Inference v6.0

Как это работало под капотом – ровно столько, сколько нужно знать

Red Hat AI использовала vLLM – это движок для запуска больших языковых моделей, оптимизированный под высокую пропускную способность. Он умеет эффективно распределять память и обрабатывать множество запросов параллельно, не теряя в скорости.

Помимо этого, применялся llm-d – распределённый планировщик запросов, который позволяет масштабировать инференс горизонтально: проще говоря, распределять нагрузку по нескольким узлам без ручной настройки каждого из них.

Всё это работало поверх OpenShift AI – платформы для запуска ИИ-задач в корпоративных средах. Её роль здесь – не столько само по себе ускорение, сколько возможность воспроизводимо и управляемо разворачивать такие системы в реальных условиях, а не только в лабораторных.

Проще говоря: команда не изобретала специализированные решения ради красивых цифр в бенчмарке – она использовала тот же стек, который применяется в реальных продуктах. Это несколько меняет смысл результата: это не «синтетический рекорд», а демонстрация того, что работающие инструменты действительно конкурентоспособны.

Открытые решения как стратегия в ИИ

Открытость как стратегия

Отдельный момент, который стоит отметить: все компоненты, использованные Red Hat, – открытые. vLLM, llm-d, модели – это не проприетарные разработки, закрытые внутри компании. Участие в MLPerf с открытым стеком – это и демонстрация возможностей, и своего рода аргумент в пользу того, что open source в ИИ-инфраструктуре перестал быть «бюджетным вариантом».

Для индустрии это не мелочь. Долгое время негласным стандартом было: хочешь лучшую производительность – используй закрытые решения, оптимизированные под конкретное оборудование. Результаты вроде этого постепенно размывают эту границу.

MLPerf Inference: что тест не учитывает

Что остаётся за кадром

MLPerf – хороший ориентир, но не абсолютная истина. Тест измеряет производительность в строго определённых условиях: конкретные модели, конкретные сценарии нагрузки, конкретные метрики. В реальных системах условия всегда другие – другие запросы, другие профили использования, другие ограничения.

Кроме того, оптимизация под бенчмарк и оптимизация под продакшн – не одно и то же. Команды, участвующие в MLPerf, знают правила игры и готовятся к ним. Насколько те же результаты воспроизводятся в «дикой природе» – отдельный вопрос, на который ни один тест не даёт окончательного ответа.

Тем не менее MLPerf остаётся одним из немногих мест, где можно честно сравнить подходы в более-менее контролируемых условиях. И появление там Red Hat AI с открытым стеком на нескольких моделях и двух платформах GPU – это как минимум сигнал, что направление выбрано не случайно.

Оригинальное название: Red Hat AI tops MLPerf Inference v6.0 with vLLM on Qwen3-VL, Whisper, and GPT-OSS-120B
Дата публикации: 1 апр 2026
Red Hat www.redhat.com Международная компания, развивающая открытые программные платформы и инфраструктурные решения с поддержкой ИИ.
Предыдущая статья Управление ИИ: почему правила без адаптации превращаются в список обходных путей Следующая статья AMD на MLPerf Inference 6.0: миллион токенов в секунду и первый выход в видеогенерацию

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

AMD рассказала о прогрессе в поддержке ИИ-моделей на своих GPU: от базовой совместимости до оптимизированной производительности, сопоставимой с конкурентами.

AMDwww.amd.com 18 фев 2026

AMD адаптировала фреймворк Miles для крупномасштабного обучения с подкреплением на GPU Instinct – теперь это работает и без оборудования NVIDIA.

LMSYS ORGlmsys.org 24 мар 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться