ИИ: События
Открытая модель LightOnOCR-2 превзошла Claude, GPT-5 и другие в распознавании таблиц
Продукты
Компания LightOn выпустила открытую модель LightOnOCR-2, которая превзошла ведущие коммерческие ИИ в задаче извлечения таблиц из документов.
Интеллектуальный хаб темы
Оценка эффективности сложных систем требует инструментов, исключающих субъективность. В этой подборке собраны материалы, посвященные методологии тестирования и сравнительному анализу производительности различных моделей – от математических алгоритмов до прогностических структур в экономике и технологиях. Мы фокусируемся не просто на фиксации цифр, а на разборе самих критериев оценки: насколько релевантны существующие метрики, какие аспекты работы остаются в «слепой зоне» стандартных тестов и как интерпретировать результаты в отрыве от маркетинговых заявлений.
ИИ: События
Продукты
Компания LightOn выпустила открытую модель LightOnOCR-2, которая превзошла ведущие коммерческие ИИ в задаче извлечения таблиц из документов.
Масштабное тестирование 16 ИИ-моделей на реальных документах показало неожиданные результаты: дорогие решения не всегда выигрывают у более доступных аналогов.
ИИ: События
Технический контекст • Исследования
Исследователи представили модель MR3, которая оценивает качество ответов языковых моделей на множестве языков – без жёстких критериев и шаблонов оценки.
Perplexity открыла доступ к двум новым моделям для смыслового поиска – они умеют быстро и точно находить нужное в миллиардах документов.
Китайская компания MiniMax выпустила M2.5 – семейство моделей с открытыми весами, которые по качеству работы приближаются к Claude 3.5 Sonnet.
ИИ: События
Разработка
Hugging Face запустил Community Evals – платформу, на которой разработчики могут самостоятельно тестировать языковые модели и делиться результатами, не полагаясь на закрытые рейтинги.
ИИ: События
Исследования
Разбираемся, какие архитектурные решения выбирают разработчики китайских опенсорс-моделей и почему декодерные подходы по-прежнему доминируют в экосистеме.
AMD представила компактную языковую модель с акцентом на логику и рассуждения, обученную с помощью стратегии голосования большинства и поэтапного подхода.
Команда Cursor рассказала, как они совершенствовали Bugbot – инструмент для автоматического исправления багов – с помощью специальной метрики на базе искусственного интеллекта.
Хотите знать о новых
экспериментах первыми?
Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.