Тематика #оптимизация инференса

ИИ: События

Qualcomm представила серверную платформу для ИИ: AI200 Rack и её значение

Инфраструктура

Qualcomm показала готовую инфраструктуру для запуска крупных ИИ-моделей: серверная стойка, карты расширения и система управления в одном решении.

Qualcommwww.qualcomm.com 2 мар 2026

ИИ: События

Как ускорить нейросеть до первого запуска: офлайн-тюнинг в PyTorch

Технический контекст • Инфраструктура

Разбираемся, как технология TunableOp позволяет заранее подобрать оптимальные параметры для нейронных сетей и зачем это нужно на практике.

AMDwww.amd.com 26 фев 2026

ИИ: События

Кэш как ресурс: как Alibaba Cloud учит ИИ не пересчитывать одно и то же дважды

Технический контекст • Инфраструктура

Alibaba Cloud представила механизм точной маршрутизации запросов к языковым моделям, который существенно повышает эффективность кэширования при распределённом инференсе.

Alibaba Cloudwww.alibabacloud.com 26 фев 2026

ИИ: События

Как безопасно обновлять ИИ-сервисы: «канареечные» релизы на нескольких кластерах

Инфраструктура

Разбираемся, как компании обновляют ИИ-сервисы без риска массовых сбоев, и почему подход с «канареечными релизами» становится стандартом индустрии.

Alibaba Cloudwww.alibabacloud.com 25 фев 2026

ИИ: События

Умное распределение нагрузки: как управлять ИИ-инференсом в нескольких облачных кластерах одновременно

Инфраструктура

Разбираемся, как приоритетное эластичное планирование помогает запускать ИИ-модели сразу в нескольких регионах и кластерах без лишних затрат.

Alibaba Cloudwww.alibabacloud.com 25 фев 2026

ИИ: События

Liquid AI выпустила LFM2-24B: большая модель с малым «аппетитом» к памяти

Продукты

Компания Liquid AI представила LFM2-24B – языковую модель на 24 миллиарда параметров, способную работать эффективнее крупных конкурентов при значительно меньших требованиях к памяти.

Liquidwww.liquid.ai 24 фев 2026

ИИ: События

Как AliSQL хранит векторы и осуществляет поиск схожих данных: детали внутренней механики

Технический контекст • Инфраструктура

AliSQL теперь поддерживает работу с векторными данными. Рассказываем, как реализованы хранение и поиск схожих элементов в базе данных, разработанной для задач искусственного интеллекта.

Alibaba Cloudwww.alibabacloud.com 24 фев 2026

ИИ: События

DeepSeek на новом оборудовании NVIDIA: что изменилось для обработки длинных текстов

Технический контекст • Инфраструктура

NVIDIA и LMSYS протестировали модель DeepSeek на новейшем ускорителе GB300. Результаты показали заметное улучшение по сравнению с предыдущим поколением.

LMSYS ORGlmsys.org 21 фев 2026

ИИ: События

AMD и искусственный интеллект: как компания догоняет лидеров рынка по производительности инференса

Инфраструктура

AMD рассказала о прогрессе в поддержке ИИ-моделей на своих GPU: от базовой совместимости до оптимизированной производительности, сопоставимой с конкурентами.

AMDwww.amd.com 18 фев 2026