Опубликовано 7 апреля 2026

LightOnOCR-2: открытая модель превзошла Claude, GPT-5 в распознавании таблиц

Открытая модель LightOnOCR-2 превзошла Claude, GPT-5 и другие в распознавании таблиц

Компания LightOn выпустила открытую модель LightOnOCR-2, которая превзошла ведущие коммерческие ИИ в задаче извлечения таблиц из документов.

Продукты 3 – 4 минуты чтения
Источник события: LightOn AI 3 – 4 минуты чтения

Если спросить, где в корпоративных документах скрыта самая ценная информация, ответ чаще всего будет один: в таблицах. Финансовые отчёты, технические спецификации, медицинские данные – всё это, как правило, структурировано именно так. И именно с таблицами у большинства ИИ-инструментов исторически возникают проблемы.

Таблицы: почему их сложно распознавать ИИ

Таблицы – это не просто текст

Проще говоря, распознать таблицу сложнее, чем кажется. Это не просто набор слов – это структура, где важно, что в какой строке и в каком столбце. Слитые ячейки, вложенные заголовки, сложная вёрстка – всё это превращает задачу в головоломку даже для мощных моделей. Именно поэтому многие компании до сих пор вручную разбирают документы или платят за специализированные сервисы.

На этом фоне компания LightOn представила вторую версию своей модели – LightOnOCR-2. Это открытая модель, специализированная на так называемом OCR, то есть на оптическом распознавании символов и структур в отсканированных или сфотографированных документах. Но главное достижение здесь – не просто распознавание символов, а умение точно извлекать таблицы со всеми строками, столбцами и их взаимосвязями.

LightOnOCR-2 превзошла гигантов: результаты теста

Как LightOnOCR-2 оказалась лучше коммерческих гигантов

В ходе сравнительного тестирования LightOnOCR-2 обошла целый ряд известных решений: Claude, GPT-5, Qwen3, Mistral и Mathpix – именно по задаче извлечения таблиц. Это примечательно по нескольким причинам.

Во-первых, большинство перечисленных моделей – коммерческие, за ними стоят крупные компании с огромными ресурсами. LightOnOCR-2 – открытая, то есть её код и веса доступны всем желающим. Во-вторых, большие универсальные модели вроде GPT-5 или Claude умеют делать многое, но нередко проигрывают более узкоспециализированным решениям именно там, где нужна точность в конкретной задаче.

Это напоминает ситуацию, когда универсальный инструмент хорош для большинства дел, но если нужно сделать что-то точно – берёшь специализированный. LightOnOCR-2 – как раз тот случай: модель заточена под работу с документами, и именно в этой нише она показывает результат выше, чем более крупные «многостаночники».

Важность качественного распознавания таблиц для бизнеса

Почему это важно для работы с документами

Задача извлечения таблиц – не абстрактный бенчмарк. За ней стоит вполне конкретная потребность: компании ежедневно работают с огромным количеством документов, где данные упакованы именно в табличном виде. Банки разбирают финансовые отчёты, больницы – медицинские карты, логистические компании – накладные. Ошибка в одной ячейке может исказить всю картину.

До сих пор автоматизация этого процесса была либо дорогой (коммерческие решения с подпиской), либо ненадёжной (универсальные модели, которые «понимают» таблицу приблизительно). LightOnOCR-2 предлагает третий вариант: открытое решение с высокой точностью, которое можно развернуть самостоятельно.

Это особенно актуально для организаций, которым важно не передавать документы во внешние облачные сервисы – по соображениям конфиденциальности или требованиям регуляторов. Локальное развёртывание открытой модели решает эту проблему.

Открытые модели: новое конкурентное преимущество

Открытость как конкурентное преимущество

LightOnOCR-2 выходит в момент, когда открытые модели всё активнее теснят коммерческие в узкоспециализированных задачах. Недавно Google выпустила семейство Gemma 4 – тоже открытые модели под лицензией Apache 2.0, которые в определённых сценариях конкурируют с решениями значительно большего размера. Тенденция очевидна: открытые разработки перестают быть «второй лигой» и начинают задавать стандарты в конкретных нишах.

В случае с LightOnOCR-2 ниша – работа с документами и таблицами. И судя по результатам тестирования, здесь открытая модель не просто не уступает коммерческим аналогам – она их превосходит.

LightOnOCR-2: перспективы и практическое применение

Что остаётся открытым

Результаты бенчмарков – это всегда срез в определённых условиях. Как модель ведёт себя на реальных документах с нестандартной вёрсткой, на языках с иной типографикой, с таблицами, где данные частично повреждены или нечитаемы – это отдельные вопросы, которые проверяются уже в практике, а не в лабораторных тестах.

Тем не менее появление сильной открытой альтернативы в нише, где долго доминировали коммерческие решения, – это заметное событие. Особенно для команд, которые ищут надёжный инструмент для работы с документами, не готовы зависеть от внешних API и хотят понимать, что именно происходит «под капотом».

Оригинальное название: Open-Source LightOnOCR-2 Just Outscored Claude, GPT-5, Qwen3, Mistral and Mathpix at Table Extraction
Дата публикации: 7 апр 2026
LightOn AI www.lighton.ai Французская компания, разрабатывающая большие языковые модели и ИИ-решения для бизнеса и науки.
Предыдущая статья PyTorch Foundation принял Helion в качестве официального проекта: что это значит для разработки ИИ Следующая статья Лифты для людей, а не люди для лифтов: как ИИ меняет подход к проектированию

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

ИИ: События

Gemma 4 на AMD: день в день с выходом модели

Технический контекст Инфраструктура

Google выпустила семейство открытых моделей Gemma 4, и AMD обеспечила их поддержку сразу в день релиза – на всём спектре своего оборудования, от дата-центров до ноутбуков.

AMDwww.amd.com 3 апр 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться