Тематика #оптимизация больших языковых моделей

ИИ: События

SGLang на NVIDIA GTC 2026: что происходило за кулисами одной из главных AI-конференций

Технический контекст • Инфраструктура

SGLang принял участие в NVIDIA GTC 2026 сразу в нескольких форматах: от упоминания в ключевом докладе до митапа на 200 человек и практической лаборатории.

LMSYS ORGlmsys.org 1 апр 2026

ИИ: События

Aurora: как ИИ научился предугадывать свои ответы и постоянно улучшаться

Технический контекст • Инфраструктура

Together AI представила Aurora – открытый фреймворк, который превращает ускорение языковых моделей в самообучающуюся систему, улучшающуюся непосредственно в ходе работы.

Together.aiwww.together.ai 1 апр 2026

ИИ: События

Когда документ слишком длинный: как маленькие модели справляются лучше больших

Исследования

Исследователи показали, что небольшие языковые модели могут превосходить GPT-4o в работе с длинными текстами, если разбить задачу на части и распределить работу между несколькими агентами.

Together.aiwww.together.ai 27 мар 2026

ИИ: События

Умная избирательность: как гибридная нейросеть запоминает только то, что важно

Технический контекст • Исследования

Новый подход к архитектуре нейросетей позволяет резко сократить объём памяти при обработке текста, не теряя при этом в качестве понимания.

Zyphrawww.zyphra.com 26 мар 2026

ИИ: События

Устойчивость к сбоям в больших языковых моделях: как DeepSeek учится работать с отказами

Технический контекст • Инфраструктура

Разработчики SGLang представили механизм частичной отказоустойчивости для моделей типа MoE – теперь сбой одного узла не останавливает всю систему.

LMSYS ORGlmsys.org 26 мар 2026

ИИ: События

Как адаптировать большую ИИ-модель для десятков языков и культур: подход Sakana AI

Исследования

Японская лаборатория Sakana AI разработала технологию, позволяющую адаптировать крупные универсальные языковые модели под конкретные языки и культуры.

Sakana AIsakana.ai 24 мар 2026

ИИ: События

TorchSpec: как ускорить работу больших языковых моделей без потери качества

Технический контекст • Разработка

Команда PyTorch представила TorchSpec – инструмент для обучения спекулятивного декодирования, который помогает ускорить работу больших языковых моделей.

PyTorchpytorch.org 21 мар 2026

ИИ: События

MR3: модель, которая оценивает ИИ-ответы на десятках языков без заранее прописанных правил

Технический контекст • Исследования

Исследователи представили модель MR3, которая оценивает качество ответов языковых моделей на множестве языков – без жёстких критериев и шаблонов оценки.

Capital Onewww.capitalone.com 16 мар 2026

ИИ: События

SGLang поддержал новую модель NVIDIA с первого дня: что это значит для ИИ-агентов

Инфраструктура

SGLang добавил поддержку модели NVIDIA Nemotron 3 Super в день её выхода – это упрощает создание многоагентных систем на основе эффективных языковых моделей.

LMSYS ORGlmsys.org 12 мар 2026