Интеллектуальный хаб темы

масштабирование моделей

Исследователи предложили способ распределить обработку сверхдлинных текстов между несколькими GPU, чтобы модели можно было обучать на контекстах до миллиона токенов.

Hugging Facehuggingface.co 10 мар 2026

AMD рассказала, как запустить языковую модель с триллионом параметров на кластере из потребительских устройств – без облака и серверных ферм.

AMDwww.amd.com 27 фев 2026

Разбираемся, как приоритетное эластичное планирование помогает запускать ИИ-модели сразу в нескольких регионах и кластерах без лишних затрат.

Alibaba Cloudwww.alibabacloud.com 25 фев 2026

Компания Liquid AI представила LFM2-24B – языковую модель на 24 миллиарда параметров, способную работать эффективнее крупных конкурентов при значительно меньших требованиях к памяти.

Liquidwww.liquid.ai 24 фев 2026

AliSQL теперь поддерживает работу с векторными данными. Рассказываем, как реализованы хранение и поиск схожих элементов в базе данных, разработанной для задач искусственного интеллекта.

Alibaba Cloudwww.alibabacloud.com 24 фев 2026

AMD представила Primus – реализацию параллельного конвейерного обучения для больших моделей, которая устраняет простои и гибко адаптируется под разные задачи.

AMDwww.amd.com 24 фев 2026

NVIDIA и LMSYS протестировали модель DeepSeek на новейшем ускорителе GB300. Результаты показали заметное улучшение по сравнению с предыдущим поколением.

LMSYS ORGlmsys.org 21 фев 2026

Китайская компания MiniMax выпустила открытую платформу Forge для обучения агентов с помощью обучения с подкреплением на масштабных GPU-кластерах.

MiniMaxwww.minimax.io 13 фев 2026

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться