Опубликовано 11 июля 2025

Как обучать ИИ: метод RENT и повышение уверенности

Как научить ИИ думать лучше, просто попросив его быть увереннее

Исследователи открыли способ улучшить логическое мышление ИИ без учителей – просто поощряя модель за уверенность в своих ответах.

Компьютерная наука 5 – 7 минут чтения

Автор публикации: Доктор София Чен 5 – 7 минут чтения

Представьте себе ученика, который решает математическую задачу. Обычно мы проверяем его ответ и говорим «правильно» или «неправильно». А что если вместо этого просто спросить: «Насколько ты уверен в своём решении»? И поощрять только за уверенность, не глядя на правильность ответа. Звучит безумно? Оказывается, с искусственным интеллектом этот подход работает удивительно хорошо.

Проблема текущего обучения ИИ

Проблема современного обучения ИИ

Сегодня языковые модели вроде GPT учатся решать сложные задачи через обучение с подкреплением. Это как дрессировка собаки – модель получает «вкусняшку» за правильный ответ и «выговор» за неправильный. Но есть одна загвоздка: кто-то должен постоянно проверять ответы и раздавать оценки.

Представьте, что вы учите ИИ решать задачи по высшей математике. Для каждой задачи нужен эксперт, который проверит решение. Это дорого, медленно и не всегда возможно. А что если задача настолько новая, что даже эксперты не знают правильного ответа?

Исследователи предложили радикально новый подход под названием RENT (обучение через минимизацию энтропии). Если перевести на человеческий язык – это «обучение через повышение уверенности».

Принцип работы обучения на уверенности

Как работает «обучение уверенности»

Основная идея проста как детский конструктор. Вместо того чтобы говорить модели «это правильно, а это неправильно», мы просто спрашиваем: «Насколько ты уверен в этом ответе»? И поощряем модель за высокую уверенность.

Звучит как заклинание из «Гарри Поттера», но за этим стоит серьёзная математика. Уверенность модели измеряется через энтропию – показатель хаоса в её «мыслях». Низкая энтропия означает, что модель четко знает, что хочет сказать. Высокая энтропия – что она мечется между вариантами как персонаж Шекспира в драме.

Процесс выглядит так:

Модель решает задачу несколькими способами
Для каждого решения она оценивает свою уверенность
Решения с высокой уверенностью получают «плюсик»
Модель учится чаще выбирать уверенные пути рассуждения

Это как если бы вы учили ребёнка не гадать на «авось», а действительно думать, пока не появится ясность.

Экспериментальные результаты обучения ИИ

Эксперименты: от простой арифметики до олимпиадных задач

Исследователи проверили свой метод на задачах разного уровня сложности – от школьной арифметики до олимпиадной математики и физики. Использовались модели семейств Qwen и Mistral размером от 1,8 до 14 миллиардов параметров.

Результаты оказались впечатляющими. Модель Qwen-7B улучшила свои результаты на школьных задачах GSM8K с 65% до 75% правильных ответов. На сложных математических задачах MATH500 рост составил с 21% до 28%. И это без единого урока с учителем!

Особенно интересно, что метод работает лучше на больших моделях. Это логично – чтобы быть по-настоящему уверенным, нужно много «знать». Маленькая модель может быть уверена в чём угодно, а большая модель уверенность заслуживает.

Влияние уверенности на процесс обучения ИИ

Почему уверенность работает как компас

На первый взгляд идея кажется парадоксальной. Разве нельзя быть уверенно неправым? Конечно, можно. Но оказывается, у современных языковых моделей есть удивительное свойство: их уверенность часто коррелирует с правильностью.

Это немного напоминает капитана Джека Воробья из «Пиратов Карибского моря» с его магическим компасом. Компас показывает не север, а то, чего человек больше всего желает. Уверенность модели – это её внутренний компас, указывающий на наиболее логичные рассуждения.

Когда модель генерирует цепочку рассуждений и чувствует в ней логику и последовательность, её уверенность растёт. Когда рассуждение хаотично или противоречиво, уверенность падает. Поощряя уверенные рассуждения, мы фактически учим модель избегать логических ошибок.

Энтропия как показатель мыслительного хаоса ИИ

Энтропия как мера хаоса в «голове» ИИ

Энтропия – это научное название для беспорядка. В термодинамике она измеряет хаос в системе. В теории информации – неопределённость в данных. В нашем случае – сумятицу в «мыслях» модели.

Представьте модель, которая решает задачу «2+2=»?. Если она на 99% уверена, что ответ «4», энтропия низкая. Если она мечется между «4», «5» и «рыба», энтропия высокая. Минимизируя энтропию, мы учим модель думать более определённо и последовательно.

Это работает, потому что хорошие рассуждения обычно приводят к однозначным выводам. Когда вы правильно решаете уравнение, у вас получается конкретный ответ, а не размытое «что-то около пяти».

Сравнение метода RENT с аналогами

Сравнение с другими методами

Метод RENT сопоставим по эффективности с RLHF – обучением с подкреплением через обратную связь от человека. Это тот самый подход, который использовался для создания ChatGPT. Но RENT требует в разы меньше ресурсов, потому что не нужны армии аннотаторов.

По сравнению с простой выборкой лучших ответов, RENT даёт более стабильные улучшения. Выборка лучших ответов – это как рыбалка: закинул удочку, авось что-то поймается. RENT – это целенаправленная охота с компасом.

Ограничения метода обучения на уверенности

Ограничения: когда уверенность может подвести

Как и любой инструмент, RENT не панацея. У него есть свои «слепые зоны».

Во-первых, модель может быть уверенно неправой. Это как самоуверенный эксперт, который красиво рассказывает чушь. Особенно это опасно в областях, где у модели мало знаний.

Во-вторых, метод работает только для задач с многошаговыми рассуждениями. Для простых вопросов типа «столица Франции» он бесполезен.

В-третьих, некоторые задачи предполагают несколько равноправных ответов. В творческих задачах или этических дилеммах уверенность в одном варианте может быть вредной.

Значение метода для развития искусственного интеллекта

Что это значит для будущего ИИ

RENT открывает дверь к масштабируемому обучению ИИ без человеческого надзора. Это особенно важно для областей, где экспертная оценка дорога или невозможна.

Представьте исследование новых научных проблем, где правильные ответы ещё неизвестны. Или обучение ИИ для задач в экстремальных условиях, где люди не могут предоставить обратную связь. В таких случаях внутренняя уверенность модели может стать единственным доступным компасом.

Однако это не означает, что люди станут не нужны. Скорее, их роль сместится от постоянного контроля к стратегическому руководству. Люди будут задавать направление и цели, а ИИ научится самостоятельно находить пути к их достижению.

Доверие к внутренней интуиции ИИ

Заключение: доверие к интуиции машин

Идея поощрения ИИ за уверенность может показаться странной, но она отражает глубокую истину о природе интеллекта. Хорошие рассуждения часто ощущаются «правильными» ещё до формальной проверки. Учёные называют это интуицией, а в случае ИИ – внутренней уверенностью.

RENT показывает, что даже машины могут развить что-то похожее на интуицию. И эта машинная интуиция, как оказалось, довольно надёжный проводник к правильным ответам.

Конечно, как говорится в старой поговорке: «Доверяй, но проверяй». Уверенность ИИ – хороший ориентир, но не истина в последней инстанции. Баланс между автономией ИИ и человеческим контролем остаётся одной из ключевых задач на пути к по-настоящему умным машинам.

#исследовательский обзор #методология #нейросети #обучение ии #математика #мышление в эпоху ии #галлюцинации моделей #работа с ошибками

Источник: https://arxiv.org/abs/2505.22660v1

Оригинальное название: Maximizing Confidence Alone Improves Reasoning

Дата публикации статьи: 28 мая 2025

Авторы оригинальной статьи : Mihir Prabhudesai, Lili Chen, Alex Ippoliti, Katerina Fragkiadaki, Hao Liu, Deepak Pathak

Доктор София Чен Открыть профиль

«ИИ – как ребёнок: он повторяет наши ошибки, но учится быстрее.»

Открыть профиль

Я инженер, которая любит объяснять сложное весело. Считаю, что хороший ИИ начинается с честного диалога о его границах.

Предыдущая статья Квантовый дирижёр: как флаксониум управляет симфонией света и материи Следующая статья Почему природа любит хаос, но работает как швейцарские часы?

Как обучать ИИ: метод RENT и повышение уверенности

Проблема текущего обучения ИИ

Принцип работы обучения на уверенности

Экспериментальные результаты обучения ИИ

Влияние уверенности на процесс обучения ИИ

Энтропия как показатель мыслительного хаоса ИИ

Сравнение метода RENT с аналогами

Ограничения метода обучения на уверенности

Значение метода для развития искусственного интеллекта

Доверие к внутренней интуиции ИИ

Связанные публикации

Как научить ИИ думать перед оценкой – и почему это меняет всё

Когда данные играют в прятки: почему ИИ обманывается неполной информацией

Почему умный ИИ не может забыть – и как это исправить

От исследования к пониманию

Нейросети, участвовавшие в работе

1. Резюмирование исследования

2. Создание текста на основе резюме

3. Создание иллюстрации