Индийская компания Sarvam AI открыла исходный код двух крупных языковых моделей – 30B и 105B – с акцентом на поддержку языков Индии.
ИИ: События
Открытый ИИ без привязки к оборудованию: зачем это нужно и кто этим занимается
Инфраструктура
Почему возможность запускать ИИ-модели на любом оборудовании становится стратегически важной задачей – и как это решают в открытом сообществе.
Alibaba Cloud открыла исходный код SysOM MCP – инструмента, который позволяет ИИ-агентам самостоятельно диагностировать проблемы в работе серверов и систем.
Alibaba DAMO Academy представила RynnBrain – открытую модель для управления роботами, способную интерпретировать окружающую среду и принимать решения в реальном мире.
ИИ: События
GGML и llama.cpp вошли в состав Hugging Face: что это значит для локального ИИ
Инфраструктура
Две ключевые библиотеки для запуска ИИ-моделей на обычных устройствах объединились с Hugging Face – и это может изменить будущее локального ИИ.
ИИ: События
Tencent выпустила самую компактную языковую модель: 0,3 млрд параметров в 600 МБ
Разработка
Китайская компания открыла исходный код модели HY-1.8B-2Bit с двухбитной квантизацией – она весит меньше, чем многие мобильные приложения.
ИИ: События
Olmix: подход Allen AI к смешиванию данных на всех этапах обучения языковых моделей
Разработка
Allen AI представил Olmix – открытый фреймворк для смешивания данных в процессе обучения языковых моделей, включая предобучение, инструктирование и выравнивание.
ИИ: События
MiniMax представила Forge – платформу для обучения ИИ-агентов на мощных вычислительных кластерах
Инфраструктура
Китайская компания MiniMax выпустила открытую платформу Forge для обучения агентов с помощью обучения с подкреплением на масштабных GPU-кластерах.
Китайская компания MiniMax выпустила M2.5 – семейство моделей с открытыми весами, которые по качеству работы приближаются к Claude 3.5 Sonnet.