Прошёл год с момента, когда DeepSeek показала, что мощные модели можно создавать без миллиардных бюджетов, – и индустрия уже не та, что была раньше.
ИИ: События
SenseTime открыла исходный код SenseNova-MARS – модели для поиска и анализа данных различных типов
Продукты
Китайская компания выпустила открытую модель, которая работает одновременно с текстом, изображениями, видео и аудио, а также способна осуществлять поиск и анализ информации.
Hugging Face представила Daggr – открытый инструмент, который помогает собирать цепочки из AI-моделей и визуально отслеживать, что происходит внутри.
Китайская модель для распознавания текста адаптирована под видеокарты AMD – разбираемся, что это значит для тех, кто работает с документами.
OpenHands запустили бенчмарк, который показывает, как модели справляются с настоящими GitHub-задачами – от исправления ошибок до добавления новых функций в open-source проектах.
ИИ: События
Claude научили писать CUDA-ядра и обучать открытые модели
Технический контекст • Разработка
Anthropic улучшила возможности Claude в работе с низкоуровневым кодом и передаче знаний другим моделям через новую функцию Extended Thinking.
ИИ: События
Как китайский опенсорс работает с архитектурами: что происходит после DeepSeek
Исследования
Разбираемся, какие архитектурные решения выбирают разработчики китайских опенсорс-моделей и почему декодерные подходы по-прежнему доминируют в экосистеме.
ИИ: События
Open Coding Agents: ИИ-помощники для кода, работающие с любым репозиторием
Технический контекст • Разработка
Allen Institute for AI представил Open Coding Agents – открытые модели для автономной работы с кодом, которые адаптируются к структуре проекта.
ИИ: События
Как LinkedIn обучал свой кодогенерирующий GPT-OSS с помощью агентного обучения с подкреплением
Технический контекст • Разработка
Команда LinkedIn поделилась опытом применения обучения с подкреплением к модели для работы с открытым исходным кодом и рассказала, с какими сложностями столкнулась в процессе.