Тематика #масштабирование моделей

ИИ: События

Как обучать ИИ на текстах длиной в миллион токенов: идея, которая меняет правила игры

Технический контекст • Инфраструктура

Исследователи предложили способ распределить обработку сверхдлинных текстов между несколькими GPU, чтобы модели можно было обучать на контекстах до миллиона токенов.

Hugging Facehuggingface.co 10 мар 2026

ИИ: События

Как AMD учит нейросети работать сообща: Ray и ROCm 7 для масштабных ML-задач

Технический контекст • Инфраструктура

AMD рассказала, как запустить распределённые ML-задачи на GPU с помощью Ray и ROCm 7 – от обучения моделей до организации агентных систем.

AMDwww.amd.com 4 мар 2026

ИИ: События

Триллион параметров на домашнем «железе»: AMD показала, как запустить гигантскую языковую модель локально

Инфраструктура

AMD рассказала, как запустить языковую модель с триллионом параметров на кластере из потребительских устройств – без облака и серверных ферм.

AMDwww.amd.com 27 фев 2026

ИИ: События

Умное распределение нагрузки: как управлять ИИ-инференсом в нескольких облачных кластерах одновременно

Инфраструктура

Разбираемся, как приоритетное эластичное планирование помогает запускать ИИ-модели сразу в нескольких регионах и кластерах без лишних затрат.

Alibaba Cloudwww.alibabacloud.com 25 фев 2026

ИИ: События

Liquid AI выпустила LFM2-24B: большая модель с малым «аппетитом» к памяти

Продукты

Компания Liquid AI представила LFM2-24B – языковую модель на 24 миллиарда параметров, способную работать эффективнее крупных конкурентов при значительно меньших требованиях к памяти.

Liquidwww.liquid.ai 24 фев 2026

ИИ: События

Как AliSQL хранит векторы и осуществляет поиск схожих данных: детали внутренней механики

Технический контекст • Инфраструктура

AliSQL теперь поддерживает работу с векторными данными. Рассказываем, как реализованы хранение и поиск схожих элементов в базе данных, разработанной для задач искусственного интеллекта.

Alibaba Cloudwww.alibabacloud.com 24 фев 2026

ИИ: События

Нулевые «пузыри» и гибкие конвейеры: как AMD ускоряет обучение больших языковых моделей

Технический контекст • Инфраструктура

AMD представила Primus – реализацию параллельного конвейерного обучения для больших моделей, которая устраняет простои и гибко адаптируется под разные задачи.

AMDwww.amd.com 24 фев 2026

ИИ: События

DeepSeek на новом оборудовании NVIDIA: что изменилось для обработки длинных текстов

Технический контекст • Инфраструктура

NVIDIA и LMSYS протестировали модель DeepSeek на новейшем ускорителе GB300. Результаты показали заметное улучшение по сравнению с предыдущим поколением.

LMSYS ORGlmsys.org 21 фев 2026

ИИ: События

MiniMax представила Forge – платформу для обучения ИИ-агентов на мощных вычислительных кластерах

Инфраструктура

Китайская компания MiniMax выпустила открытую платформу Forge для обучения агентов с помощью обучения с подкреплением на масштабных GPU-кластерах.

MiniMaxwww.minimax.io 13 фев 2026