Языковая модель для работы с научной литературой получила признание одного из самых авторитетных изданий в мире науки.
Прошёл год с момента, когда DeepSeek показала, что мощные модели можно создавать без миллиардных бюджетов, – и индустрия уже не та, что была раньше.
Лаборатория
Как научить ИИ открывать новое прямо на танцполе: обучение нейросетей во время тестирования
Компьютерная наука
Исследователи научили языковую модель находить лучшие решения в науке не через предварительную подготовку, а через обучение прямо в процессе работы над конкретной задачей.
ИИ: События
Claude научили писать CUDA-ядра и обучать открытые модели
Технический контекст • Разработка
Anthropic улучшила возможности Claude в работе с низкоуровневым кодом и передаче знаний другим моделям через новую функцию Extended Thinking.
ИИ: События
Как китайский опенсорс работает с архитектурами: что происходит после DeepSeek
Исследования
Разбираемся, какие архитектурные решения выбирают разработчики китайских опенсорс-моделей и почему декодерные подходы по-прежнему доминируют в экосистеме.
ИИ: События
Trinity Large: что внутри и почему Arcee выпустила три версии одной модели
Технический контекст • Продукты
Разбираемся, как устроена Trinity Large от Arcee AI – новая языковая модель с разреженной архитектурой и тремя контрольными точками на выбор.
ИИ: События
Open Coding Agents: ИИ-помощники для кода, работающие с любым репозиторием
Технический контекст • Разработка
Allen Institute for AI представил Open Coding Agents – открытые модели для автономной работы с кодом, которые адаптируются к структуре проекта.
AMD представила компактную языковую модель с акцентом на логику и рассуждения, обученную с помощью стратегии голосования большинства и поэтапного подхода.
Компактная модель GLM-4.7-Flash теперь доступна как решение с открытым исходным кодом. Это попытка найти баланс между производительностью и возможностью запуска на обычном оборудовании.