Тематика #бенчмарки моделей

ИИ: События

Открытая модель LightOnOCR-2 превзошла Claude, GPT-5 и другие в распознавании таблиц

Продукты

Компания LightOn выпустила открытую модель LightOnOCR-2, которая превзошла ведущие коммерческие ИИ в задаче извлечения таблиц из документов.

LightOn AIwww.lighton.ai 7 апр 2026

ИИ: События

16 ИИ-моделей, 9000 документов: кто справился лучше всех

Продукты

Масштабное тестирование 16 ИИ-моделей на реальных документах показало неожиданные результаты: дорогие решения не всегда выигрывают у более доступных аналогов.

Nanonetsnanonets.com 20 мар 2026

ИИ: События

MR3: модель, которая оценивает ИИ-ответы на десятках языков без заранее прописанных правил

Технический контекст • Исследования

Исследователи представили модель MR3, которая оценивает качество ответов языковых моделей на множестве языков – без жёстких критериев и шаблонов оценки.

Capital Onewww.capitalone.com 16 мар 2026

ИИ: События

Perplexity выпустила собственные модели для поиска по огромным массивам текста

Продукты

Perplexity открыла доступ к двум новым моделям для смыслового поиска – они умеют быстро и точно находить нужное в миллиардах документов.

Perplexity AIresearch.perplexity.ai 27 фев 2026

ИИ: События

MiniMax M2.5: открытые модели догоняют Claude Sonnet

Продукты

Китайская компания MiniMax выпустила M2.5 – семейство моделей с открытыми весами, которые по качеству работы приближаются к Claude 3.5 Sonnet.

OpenHandsopenhands.dev 13 фев 2026

ИИ: События

Community Evals от Hugging Face: когда сообщество само решает проверять модели

Разработка

Hugging Face запустил Community Evals – платформу, на которой разработчики могут самостоятельно тестировать языковые модели и делиться результатами, не полагаясь на закрытые рейтинги.

Hugging Facehuggingface.co 7 фев 2026

ИИ: События

Как китайский опенсорс работает с архитектурами: что происходит после DeepSeek

Исследования

Разбираемся, какие архитектурные решения выбирают разработчики китайских опенсорс-моделей и почему декодерные подходы по-прежнему доминируют в экосистеме.

Hugging Facehuggingface.co 28 янв 2026

ИИ: События

AMD выпустила ReasonLite-0.6B – компактную модель для логических рассуждений

Продукты

AMD представила компактную языковую модель с акцентом на логику и рассуждения, обученную с помощью стратегии голосования большинства и поэтапного подхода.

AMDwww.amd.com 21 янв 2026

ИИ: События

Как Cursor улучшили свой ИИ-отладчик

Команда Cursor рассказала, как они совершенствовали Bugbot – инструмент для автоматического исправления багов – с помощью специальной метрики на базе искусственного интеллекта.

Cursor AIcursor.com 16 янв 2026