Опубликовано 4 февраля 2026

Tencent открыла код библиотеки HPC-Ops: как ускорить инференс больших моделей на 30%

Китайская компания выпустила набор оптимизированных операторов для работы с большими языковыми моделями (LLM) – обещают заметный прирост скорости без смены архитектуры.

Инфраструктура / Технический контекст 3 – 4 минуты чтения

Источник события: Tencent 3 – 4 минуты чтения

Tencent выложила в открытый доступ библиотеку HPC-Ops – набор низкоуровневых операторов для инференса больших языковых моделей. По данным компании, использование этих компонентов позволяет увеличить пропускную способность систем вывода примерно на 30% по сравнению со стандартными решениями.

Что такое операторы в языковых моделях и зачем их оптимизировать

Что такое операторы и зачем их оптимизировать

Когда языковая модель генерирует текст, она выполняет множество однотипных математических операций: умножение матриц, применение функций активации, расчёт внимания между токенами. Каждая такая операция – это оператор. От того, насколько эффективно они работают на конкретном оборудовании, зависит скорость ответа модели и количество запросов, которые сервер может обработать одновременно.

В больших продакшен-системах даже небольшое ускорение каждого оператора складывается в ощутимый выигрыш: модель отвечает быстрее, нагрузка распределяется лучше, можно обслужить больше пользователей на том же оборудовании.

Библиотека HPC-Ops от Tencent для ускорения инференса LLM

Что сделала Tencent

Команда Hunyuan AI – внутреннего подразделения Tencent, работающего с искусственным интеллектом – выпустила библиотеку операторов, заточенных под специфику инференса больших языковых моделей (LLM). Это не полноценный фреймворк для развёртывания моделей, а именно набор оптимизированных вычислительных блоков, которые можно встроить в существующие системы.

Основная идея – использовать особенности современных графических процессоров (GPU) и учесть типичные паттерны работы языковых моделей. Например, операции с вниманием или обработка длинных последовательностей токенов требуют специфичной работы с памятью и параллелизмом. HPC-Ops предлагает реализации, адаптированные под эти сценарии.

Прирост производительности при использовании HPC-Ops

Насколько это быстрее

Tencent заявляет о росте пропускной способности на 30%. Проще говоря, при той же инфраструктуре система может обрабатывать больше запросов в единицу времени. Это не значит, что каждый отдельный ответ станет в полтора раза быстрее – речь скорее о том, что сервер сможет эффективнее распоряжаться ресурсами при параллельной работе с несколькими пользователями.

Конкретные цифры зависят от модели, размера батча, длины контекста и оборудования. Но для компаний, которые обслуживают тысячи запросов в секунду, даже 20-30% прироста – это серьёзная экономия на оборудовании и электроэнергии.

Зачем Tencent открыла код библиотеки HPC-Ops

Зачем это открывать

Tencent использует эту библиотеку в собственных продуктах, где развёрнуты большие языковые модели. Теперь код доступен всем – это типичная стратегия крупных технологических компаний: поделиться инструментами, которые уже обкатаны в продакшене, чтобы поднять общий уровень инфраструктуры в индустрии и, возможно, получить обратную связь от сообщества.

Для разработчиков и команд, которые занимаются развёртыванием моделей, это возможность не писать оптимизации с нуля, а взять готовое решение, протестированное на реальных нагрузках.

Кому подойдёт библиотека HPC-Ops для работы с моделями

Кому это может быть полезно

В первую очередь – тем, кто работает с инференсом на уровне инфраструктуры: инженерам ML-платформ, разработчикам систем обслуживания моделей, командам, которые оптимизируют затраты на вычисления. Если вы просто используете API от OpenAI или аналогов, HPC-Ops вам не понадобится – это инструмент для тех, кто сам разворачивает и обслуживает модели.

Библиотека может быть интересна и исследователям, которые изучают производительность моделей или разрабатывают собственные системы инференса. Возможность заглянуть в код, который используется в продакшене крупной компании, даёт неплохую точку отсчёта.

Перспективы развития библиотеки HPC-Ops

Что дальше

Пока HPC-Ops – это первый релиз. Насколько активно библиотека будет развиваться и поддерживаться, покажет время. Открытый код не гарантирует живого сообщества и регулярных обновлений, но сам факт публикации говорит о том, что Tencent рассматривает инфраструктуру для искусственного интеллекта как область, где имеет смысл делиться наработками.

Для индустрии это ещё один шаг в сторону стандартизации и доступности высокопроизводительных инструментов. Чем больше таких библиотек появляется в открытом доступе, тем проще становится строить эффективные системы без необходимости изобретать всё заново.

#событие #прикладной разбор #нейросети #инженерия #инфраструктура #бизнес #оптимизация gpu #оптимизация инференса

Ссылка на публикацию: https://mp.weixin.qq.com/s/zyDXLiRJWhol-Uvq72efOQ

Оригинальное название: 腾讯混元AI Infra核心技术重磅开源：推理吞吐提升30%

Дата публикации: 3 фев 2026

Tencent hunyuan.tencent.com Китайский технологический холдинг, развивающий ИИ для социальных платформ, игр, облака и цифровых сервисов.

Предыдущая статья Hunyuan запустил исследовательский блог: как контекст меняет подход к языковым моделям Следующая статья OpenScholar упомянут в Nature – что это значит для научного ИИ

Tencent открыла код библиотеки HPC-Ops: как ускорить инференс больших моделей на 30%

Что такое операторы в языковых моделях и зачем их оптимизировать

Библиотека HPC-Ops от Tencent для ускорения инференса LLM

Прирост производительности при использовании HPC-Ops

Зачем Tencent открыла код библиотеки HPC-Ops

Кому подойдёт библиотека HPC-Ops для работы с моделями

Перспективы развития библиотеки HPC-Ops

Связанные публикации

AMD показала результаты тестов видеокарты Instinct MI355X на задачах вывода

AMD выпустила Ryzen AI Software 1.7 – что нового в платформе для локального ИИ

Hummingbird-XT: как AMD запустила генерацию видео на обычных видеокартах

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации