Alibaba выпустила предварительную версию своей следующей флагманской языковой модели – Qwen3.5-Max-Preview, которая уже появилась на публичной платформе.
ИИ: События
Как адаптировать большую ИИ-модель для десятков языков и культур: подход Sakana AI
Исследования
Японская лаборатория Sakana AI разработала технологию, позволяющую адаптировать крупные универсальные языковые модели под конкретные языки и культуры.
ИИ: События
AMD открыла доступ к мощному RL-обучению на своих GPU: что это значит для разработчиков
Технический контекст • Инфраструктура
AMD адаптировала фреймворк Miles для крупномасштабного обучения с подкреплением на GPU Instinct – теперь это работает и без оборудования NVIDIA.
Mistral выпустила новую компактную модель Small 4 – она быстрее, точнее и лучше работает с текстами на разных языках, включая русский.
Mistral AI вступила в коалицию NVIDIA Nemotron – партнёрство, нацеленное на развитие открытых языковых моделей и мультимодальных возможностей ИИ.
ИИ: События
Японские госорганы выбрали отечественную языковую модель для государственного ИИ
Регулирование
KDDI и ELYZA вошли в список поставщиков языковых моделей для государственной ИИ-программы японского Министерства цифровых технологий.
ИИ: События
Mamba-3: быстрее трансформеров на практике, а не только на бумаге
Технический контекст • Исследования
Вышла Mamba-3 – открытая языковая модель, которая обгоняет трансформеры по скорости генерации текста и превосходит предыдущие версии по качеству.
Компания Hcompany представила Holotron-12B – языковую модель, способную самостоятельно управлять компьютером и выполнять задачи в интерфейсах реальных приложений.
AMD рассказала, как развернуть языковую модель Qwen3-5 на своём облачном сервисе Developer Cloud с помощью фреймворка SGLang – без лишних сложностей.