Опубликовано

Hummingbird-XT: как AMD запустила генерацию видео на обычных видеокартах

AMD представила Hummingbird-XT — оптимизированную модель для генерации видео, которая работает на потребительских GPU с ROCm благодаря квантованию и ускоренным вычислениям.

Источник события: AMD Время чтения: 3 – 4 минуты

Генеративные модели для видео — это одна из самых ресурсоёмких задач в современном искусственном интеллекте. Обычно для их работы нужны мощные серверные графические процессоры с десятками гигабайт видеопамяти. Но AMD решила пойти другим путём и адаптировала такую модель для работы на обычных потребительских видеокартах.

Что такое Hummingbird-XT

Hummingbird-XT — это оптимизированная версия генеративной модели для создания видео, которая может работать на графических процессорах AMD с поддержкой ROCm. Проще говоря, это попытка сделать видеогенерацию доступной не только владельцам серверного оборудования, но и тем, у кого обычная игровая или рабочая видеокарта.

Основная идея — взять диффузионную модель, которая обычно требует огромных ресурсов, и сжать её так, чтобы она помещалась в память потребительской карты и работала достаточно быстро для практического применения.

Как это работает 🔧

Главный приём здесь — квантование. Это процесс, при котором веса модели переводятся из 32-битного или 16-битного представления в более компактное — например, 8-битное или даже 4-битное. Размер модели при этом уменьшается в несколько раз, а вместе с ним падает и потребление памяти.

Конечно, квантование обычно снижает точность вычислений. Но в случае с генеративными моделями это не всегда критично — небольшая потеря качества часто остаётся незаметной для пользователя, особенно если процесс оптимизации проведён аккуратно.

Кроме того, AMD использует возможности своей платформы ROCm для ускорения вычислений. ROCm — это программная экосистема AMD для графических процессоров, нечто вроде CUDA у NVIDIA. Она позволяет запускать нейросети на видеокартах Radeon и использовать специализированные библиотеки для ускорения операций вроде свёртки, матричных умножений и активаций.

Почему это важно

До сих пор генерация видео оставалась довольно закрытой областью — либо через облачные сервисы, либо на дорогом оборудовании. Появление решений вроде Hummingbird-XT расширяет круг людей, которые могут экспериментировать с такими технологиями локально.

Это особенно актуально для разработчиков, исследователей и энтузиастов, которые хотят работать с моделями без привязки к облаку — либо по соображениям конфиденциальности, либо просто для удобства.

Кроме того, для AMD это шаг в сторону укрепления позиций на рынке решений для искусственного интеллекта. Долгое время экосистема машинного обучения была ориентирована на NVIDIA, и любые усилия по развитию альтернатив — это полезная конкуренция.

Какие ограничения остаются

Несмотря на оптимизацию, генерация видео всё равно остаётся тяжёлой задачей. Даже на потребительских картах процесс может занимать заметное время, особенно если речь идёт о длинных роликах или высоком разрешении.

Квантование, хоть и помогает уместить модель в память, всё же вносит некоторые артефакты. В зависимости от сценария использования это может быть незначительным компромиссом или заметным снижением качества.

Также стоит учитывать, что ROCm поддерживается не на всех видеокартах AMD. Если у вас старая модель или карта из бюджетного сегмента, запуск может оказаться невозможным или потребует дополнительных настроек.

Что дальше

Hummingbird-XT — это пример того, как индустрия постепенно движется в сторону локальных решений. Мы видим похожие тенденции и в текстовых моделях: сначала всё было в облаке, потом появились компактные версии для ноутбуков и настольных компьютеров.

Вероятно, через пару лет генерация видео на локальном оборудовании станет таким же обыденным делом, как сейчас генерация изображений. Но пока это всё ещё область активных экспериментов, и такие проекты помогают понять, где проходят границы возможного.

Если у вас есть графический процессор AMD с поддержкой ROCm и интерес к видеогенерации — Hummingbird-XT может стать неплохой точкой входа для экспериментов.

Оригинальное название: Bridging the Last Mile: Deploying Hummingbird-XT for Efficient Video Generation on AMD Consumer-Grade Platforms — ROCm Blogs
Дата публикации: 8 янв 2026
AMDwww.amd.com Международная компания – производитель процессоров и вычислительных ускорителей для ИИ-задач.
Предыдущая статья StormCast: как AMD использует ИИ для прогноза погоды на своих GPU Следующая статья Niji V7 — новая версия аниме-генератора от Midjourney

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.5 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.5 Anthropic
2.
Llama 4 Maverick Meta AI Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Llama 4 Maverick Meta AI
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

ИИ: События

Вам может быть интересно

Перейти ко всем событиям

Другие события из мира искусственного интеллекта, которые помогают увидеть общую картину и понять, как меняется направление развития технологий.

Компания AMD представила Micro-World – первые модели мира (world models) с открытым исходным кодом. Они способны генерировать видео с учетом действий пользователя в реальном времени и оптимизированы для работы на графических процессорах компании.

Hugging Face запустил Community Evals – платформу, на которой разработчики могут самостоятельно тестировать языковые модели и делиться результатами, не полагаясь на закрытые рейтинги.

Команда Perplexity AI продемонстрировала, как технология прямой передачи данных между серверами помогает языковым моделям работать быстрее и эффективнее, устраняя «узкие места» в сетевой инфраструктуре.

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться