Опубликовано 4 февраля 2026

LG создала собственную языковую модель K-EXAONE для корейского языка

K-EXAONE: как южнокорейская LG строит собственную большую языковую модель

LG AI Research рассказала о K-EXAONE – мультимодальной модели, созданной на собственной технологической базе и ориентированной на корейский язык и культурный контекст.

Продукты 3 – 5 минут чтения

Источник события: LG AI Research 3 – 5 минут чтения

Большие языковые модели обычно развиваются по одному из двух сценариев. Первый – взять готовое решение вроде GPT или Llama, дообучить его под свои задачи и запустить. Второй – построить всё с нуля: собрать данные, разработать архитектуру, обучить модель и поддерживать её развитие самостоятельно. Второй путь намного сложнее, но он даёт больше контроля и возможность учесть специфику языка и культуры.

LG AI Research выбрала именно этот подход, создав K-EXAONE – мультимодальную модель, которая работает с текстом и изображениями, понимает корейский язык на уровне носителя и учитывает культурный контекст. Проект развивается уже несколько лет, и недавно команда рассказала, как именно строилась эта система.

Почему LG решила создать языковую модель с нуля

Зачем создавать модель с нуля?

Основная причина – язык. Корейский сильно отличается от английского не только грамматикой, но и логикой построения текста, контекстными нюансами и культурными отсылками. Модели, обученные преимущественно на англоязычных данных, могут работать с корейским текстом, но часто делают это не так точно и естественно, как хотелось бы.

LG не стала адаптировать чужую модель, а решила построить собственную – так, чтобы она изначально понимала особенности языка и могла применяться в реальных корейских продуктах и сервисах. Это касается не только текста, но и мультимодальности: способности работать одновременно с текстом и изображениями, понимая, как они связаны друг с другом.

Что такое K-EXAONE?

K-EXAONE – это семейство моделей, которые могут обрабатывать текст и изображения. Есть версии разного размера: от более компактных до крупных, способных решать сложные задачи. Модель обучена на большом объёме корейских и англоязычных данных, что позволяет ей работать с обоими языками, но с акцентом на корейский.

Ключевое отличие – это не просто языковая модель, а мультимодальная система. То есть она может, например, анализировать изображение и описывать его на корейском, отвечать на вопросы по картинке или генерировать текст на основе визуального контекста. Для многих прикладных задач – от образования до коммерческих сервисов – это важная возможность.

Как LG разрабатывала и обучала K-EXAONE

Как строилась модель?

Процесс начался с подготовки данных. LG собрала корпус текстов на корейском языке из открытых источников, книг, статей, веб-страниц. Параллельно готовились данные для мультимодального обучения – пары изображений и текстов, которые помогают модели понять связь между визуальным и текстовым содержанием.

Архитектура модели разрабатывалась внутри компании. Это трансформерная модель – тот же базовый подход, что используется в GPT, Claude и других системах, но с настройками, адаптированными под специфику корейского языка и мультимодальную работу.

Обучение проходило на собственной инфраструктуре LG, с использованием большого количества вычислительных ресурсов. После базового обучения модель дообучалась на специализированных данных, чтобы улучшить её поведение в диалогах, повысить точность ответов и сделать её более безопасной.

Для чего LG нужна собственная языковая модель

Зачем это LG?

LG – это не только бытовая техника, но и целая экосистема продуктов и сервисов: от умных домов до платформ для бизнеса. Собственная языковая модель даёт компании возможность встраивать ИИ в свои решения без зависимости от внешних поставщиков.

Это важно не только с точки зрения контроля над технологией, но и с точки зрения данных. Используя собственную модель, компания может обрабатывать информацию локально, не передавая её сторонним сервисам. Для корпоративных клиентов и пользователей, которые заботятся о приватности, это существенный аргумент.

Кроме того, модель может быть адаптирована под конкретные задачи: от автоматизации поддержки клиентов до аналитики данных внутри компании. Это гибкость, которую сложно получить, используя готовые решения.

Планы развития K-EXAONE и открытый доступ

Что дальше?

LG продолжает развивать K-EXAONE. Планируется улучшение мультимодальных возможностей, расширение поддержки языков и повышение качества ответов в сложных сценариях. Модель уже используется внутри компании, и со временем может стать основой для публичных сервисов.

Важный момент – открытость. LG выпустила некоторые версии модели в открытый доступ, что позволяет исследователям и разработчикам работать с ней, тестировать и предлагать улучшения. Это редкий шаг для крупной корпорации, особенно в Азии, где многие технологии остаются закрытыми.

K-EXAONE – пример того, как крупная компания может построить собственную языковую модель, не полагаясь на готовые решения. Это долгий и ресурсоёмкий путь, но он даёт контроль над технологией, возможность учесть культурные и языковые особенности и гибкость в применении. Для корейского рынка это особенно актуально – и LG показывает, что такой подход вполне реализуем.

#аналитика #прикладной разбор #развитие ии #лингвистика ии #инженерия #инфраструктура #бизнес #открытые технологии #мультимодальные модели

Ссылка на публикацию: https://www.lgresearch.ai/blog/view?seq=619

Оригинальное название: Korea's Flagship AI, Completed with Proprietary Technology: K-EXAONE

Дата публикации: 4 фев 2026

LG AI Research www.lgresearch.ai Южнокорейское исследовательское подразделение, разрабатывающее ИИ-модели для продуктов и технологий LG.

Предыдущая статья Где философия встречается с ИИ: когда технологиям нужны смыслы Следующая статья Новая модель SciNO решает задачу восстановления причинно-следственных связей

LG создала собственную языковую модель K-EXAONE для корейского языка

Почему LG решила создать языковую модель с нуля

Что такое K-EXAONE?

Как LG разрабатывала и обучала K-EXAONE

Для чего LG нужна собственная языковая модель

Планы развития K-EXAONE и открытый доступ

Связанные публикации

SenseTime открыла исходный код SenseNova-MARS – модели для поиска и анализа данных различных типов

Год после DeepSeek: как открытый ИИ изменил правила игры

GLM-4.7-Flash: открытая и бесплатная языковая модель

От источника к разбору

Нейросети, участвовавшие в работе

1. Анализ исходной публикации и написание текста

2. Проверка и правка текста

3. Подготовка описания для иллюстрации

4. Создание иллюстрации