Опубликовано 4 марта 2026

AMD учит нейросети работать сообща: Ray и ROCm 7 для ML-задач

Как AMD учит нейросети работать сообща: Ray и ROCm 7 для масштабных ML-задач

AMD рассказала, как запустить распределённые ML-задачи на GPU с помощью Ray и ROCm 7 – от обучения моделей до организации агентных систем.

Инфраструктура / Технический контекст 4 – 6 минут чтения
Источник события: AMD 4 – 6 минут чтения

Когда модель машинного обучения перестаёт помещаться в один GPU или когда задача слишком велика для последовательного решения, разработчики начинают думать о распределённых вычислениях. Проще говоря, о том, как заставить несколько машин или чипов работать вместе как единая система.

AMD недавно опубликовала подробный материал о том, как именно это можно сделать с помощью Ray и новой ROCm 7 – фреймворка компании для работы с GPU на своих ускорителях. Разберёмся, что здесь происходит и почему это интересно.

Что такое Ray

Ray – это что?

Ray – это инструмент с открытым исходным кодом, который позволяет запускать Python-код на нескольких машинах одновременно, как будто это одна большая программа. Он давно используется в ML-сообществе: с его помощью удобно распределять обучение моделей, параллельно обрабатывать данные или строить сложные пайплайны, в которых несколько компонентов работают независимо друг от друга.

Раньше Ray на оборудовании AMD требовал дополнительных усилий при настройке. Теперь с выходом ROCm 7 ситуация заметно улучшилась: поддержка стала более плотной, а значит – меньше «танцев с бубном» при развёртывании.

Какие возможности показала AMD

Что конкретно показала AMD

Публикация AMD – это не просто анонс совместимости. Это набор практических сценариев с примерами кода, где показано, что именно можно делать с Ray на ROCm 7. Сценарии охватывают несколько уровней сложности – от относительно простых задач до многокомпонентных систем.

Тонкая настройка больших языковых моделей

Один из ключевых сценариев – тонкая настройка больших языковых моделей с применением RLHF (обучения с подкреплением на основе обратной связи от человека). Это метод, при котором модель обучается не просто на текстах, а на основе человеческих оценок – чтобы её ответы становились полезнее и точнее. Такой подход используется, например, при создании чат-ботов.

Проблема в том, что RLHF – ресурсоёмкий процесс. Здесь задействованы сразу несколько компонентов: основная модель, модель-критик, модель-генератор и другие. Держать всё это на одном GPU невозможно. Ray позволяет распределить нагрузку между несколькими ускорителями – и именно это демонстрирует AMD на своём оборудовании.

Пакетная обработка и параллельный вывод

Второй сценарий – это массовая генерация текста. Представьте, что нужно прогнать через языковую модель тысячи запросов – например, классифицировать документы, сгенерировать описания к товарам или разметить датасет. Делать это последовательно – долго. Ray позволяет разбить задачу на части и обработать их параллельно на нескольких GPU.

AMD показывает, как это выглядит в связке с vLLM – движком для эффективного вывода (то есть запуска уже обученной модели для получения ответов). Результат: та же работа выполняется быстрее, а GPU при этом загружены равномерно.

Агентные системы с несколькими моделями

Пожалуй, самый интересный сценарий – это мультиагентные системы. Если коротко: это когда несколько ИИ-моделей работают вместе, каждая выполняет свою роль, и в итоге система решает задачи, которые одной модели не под силу.

Например, одна модель может отвечать за анализ текста, другая – за поиск информации, третья – за финальный ответ пользователю. Ray в этом контексте выступает как «диспетчер»: он распределяет задачи между агентами, следит за их состоянием и передаёт данные между ними.

AMD демонстрирует подобную схему на основе фреймворка LangGraph – инструмента для построения агентных пайплайнов. На практике это выглядит как граф, где узлы – это отдельные шаги или компоненты, а рёбра – передача данных между ними. Ray берёт на себя всю «инфраструктурную» часть: кто что считает, на каком GPU, в каком порядке.

ROCm 7. Почему это важный шаг

Почему ROCm 7 – это важный шаг

AMD давно развивает ROCm как альтернативу CUDA – проприетарной платформе NVIDIA, которая фактически стала стандартом для GPU-вычислений в машинном обучении. Проблема в том, что большинство инструментов в экосистеме машинного обучения писались изначально под CUDA – и портирование на оборудование AMD нередко было сопряжено с головной болью.

ROCm 7 – это попытка закрыть этот разрыв. Публикация AMD фактически говорит: смотрите, вот рабочие примеры с популярными инструментами, и всё это работает на нашем оборудовании без принципиальных ограничений. Это важно не только для тех, кто уже использует GPU от AMD, но и для тех, кто только рассматривает такую возможность как альтернативу NVIDIA.

Для кого это полезно

Кому это может быть полезно

Прежде всего – командам, которые работают с большими моделями и сталкиваются с вычислительными ограничениями. Если задача «не влезает» в один GPU или одну машину, Ray – один из разумных способов масштабироваться горизонтально.

Также это актуально для тех, кто строит сложные ML-системы с несколькими компонентами: агентами, несколькими моделями, параллельными пайплайнами. Ray даёт удобную абстракцию поверх сложной инфраструктуры – не нужно вручную управлять тем, что и где выполняется.

Ну и для тех, кто присматривается к ускорителям AMD как к альтернативе NVIDIA: этот материал – хороший сигнал, что экосистема развивается и популярные инструменты работают.

Что стоит учесть

Что остаётся за кадром

Публикация AMD – это, по сути, техническое руководство с акцентом на то, что всё работает. Это полезно, но стоит держать в голове несколько вещей.

Во-первых, реальная производительность в боевых условиях может отличаться от демонстрационных примеров – это справедливо для любого технического обзора. Во-вторых, экосистема вокруг ROCm всё ещё уступает CUDA по зрелости: часть библиотек и инструментов поддерживает оборудование AMD с задержкой или вовсе не поддерживает. В-третьих, сами сценарии подобраны так, чтобы показать сильные стороны – это нормально для материалов поставщика, но требует критического взгляда при переносе на собственные задачи.

Тем не менее направление понятно: AMD последовательно работает над тем, чтобы её GPU были не просто физически доступны, но и реально удобны в использовании для современных ML-задач. Ray с поддержкой ROCm 7 – один из шагов в эту сторону.

Оригинальное название: Exploring Use Cases for Scalable AI: Implementing Ray with ROCm 7 Support for Efficient ML Workflows – ROCm Blogs
Дата публикации: 27 фев 2026
AMD www.amd.com Международная компания – производитель процессоров и вычислительных ускорителей для ИИ-задач.
Предыдущая статья Mistral Document AI в Microsoft Foundry: что это значит для работы с документами Следующая статья EDiTh: как проверить корпоративный поиск, не раскрывая секреты компании

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Новая связка TorchFT и TorchTitan позволяет продолжать обучение моделей на графических процессорах AMD даже после отказа узлов кластера – без полной перезагрузки процесса.

AMDwww.amd.com 10 фев 2026

AMD представила Primus – реализацию параллельного конвейерного обучения для больших моделей, которая устраняет простои и гибко адаптируется под разные задачи.

AMDwww.amd.com 24 фев 2026

AMD показала, как организовать обучение LLM на GPU-кластерах так, чтобы сбои устранялись автоматически, а не превращались в ручную работу.

AMDwww.amd.com 4 мар 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться