Интеллектуальный хаб темы

оптимизация инференса

ИИ: События

Кэш как ресурс: как Alibaba Cloud учит ИИ не пересчитывать одно и то же дважды

Технический контекст Инфраструктура

Alibaba Cloud представила механизм точной маршрутизации запросов к языковым моделям, который существенно повышает эффективность кэширования при распределённом инференсе.

Alibaba Cloudwww.alibabacloud.com 26 фев 2026

Разбираемся, как компании обновляют ИИ-сервисы без риска массовых сбоев, и почему подход с «канареечными релизами» становится стандартом индустрии.

Alibaba Cloudwww.alibabacloud.com 25 фев 2026

Разбираемся, как приоритетное эластичное планирование помогает запускать ИИ-модели сразу в нескольких регионах и кластерах без лишних затрат.

Alibaba Cloudwww.alibabacloud.com 25 фев 2026

Компания Liquid AI представила LFM2-24B – языковую модель на 24 миллиарда параметров, способную работать эффективнее крупных конкурентов при значительно меньших требованиях к памяти.

Liquidwww.liquid.ai 24 фев 2026

AliSQL теперь поддерживает работу с векторными данными. Рассказываем, как реализованы хранение и поиск схожих элементов в базе данных, разработанной для задач искусственного интеллекта.

Alibaba Cloudwww.alibabacloud.com 24 фев 2026

NVIDIA и LMSYS протестировали модель DeepSeek на новейшем ускорителе GB300. Результаты показали заметное улучшение по сравнению с предыдущим поколением.

LMSYS ORGlmsys.org 21 фев 2026

AMD рассказала о прогрессе в поддержке ИИ-моделей на своих GPU: от базовой совместимости до оптимизированной производительности, сопоставимой с конкурентами.

AMDwww.amd.com 18 фев 2026

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться