Опубликовано 11 июля 2025

Как обучать ИИ: метод RENT и повышение уверенности

Как научить ИИ думать лучше, просто попросив его быть увереннее

Исследователи открыли способ улучшить логическое мышление ИИ без учителей – просто поощряя модель за уверенность в своих ответах.

Компьютерная наука 5 – 7 минут чтения
Автор публикации: Доктор София Чен 5 – 7 минут чтения

Представьте себе ученика, который решает математическую задачу. Обычно мы проверяем его ответ и говорим «правильно» или «неправильно». А что если вместо этого просто спросить: «Насколько ты уверен в своём решении»? И поощрять только за уверенность, не глядя на правильность ответа. Звучит безумно? Оказывается, с искусственным интеллектом этот подход работает удивительно хорошо.

Проблема текущего обучения ИИ

Проблема современного обучения ИИ

Сегодня языковые модели вроде GPT учатся решать сложные задачи через обучение с подкреплением. Это как дрессировка собаки – модель получает «вкусняшку» за правильный ответ и «выговор» за неправильный. Но есть одна загвоздка: кто-то должен постоянно проверять ответы и раздавать оценки.

Представьте, что вы учите ИИ решать задачи по высшей математике. Для каждой задачи нужен эксперт, который проверит решение. Это дорого, медленно и не всегда возможно. А что если задача настолько новая, что даже эксперты не знают правильного ответа?

Исследователи предложили радикально новый подход под названием RENT (обучение через минимизацию энтропии). Если перевести на человеческий язык – это «обучение через повышение уверенности».

Принцип работы обучения на уверенности

Как работает «обучение уверенности»

Основная идея проста как детский конструктор. Вместо того чтобы говорить модели «это правильно, а это неправильно», мы просто спрашиваем: «Насколько ты уверен в этом ответе»? И поощряем модель за высокую уверенность.

Звучит как заклинание из «Гарри Поттера», но за этим стоит серьёзная математика. Уверенность модели измеряется через энтропию – показатель хаоса в её «мыслях». Низкая энтропия означает, что модель четко знает, что хочет сказать. Высокая энтропия – что она мечется между вариантами как персонаж Шекспира в драме.

Процесс выглядит так:

  1. Модель решает задачу несколькими способами
  2. Для каждого решения она оценивает свою уверенность
  3. Решения с высокой уверенностью получают «плюсик»
  4. Модель учится чаще выбирать уверенные пути рассуждения

Это как если бы вы учили ребёнка не гадать на «авось», а действительно думать, пока не появится ясность.

Экспериментальные результаты обучения ИИ

Эксперименты: от простой арифметики до олимпиадных задач

Исследователи проверили свой метод на задачах разного уровня сложности – от школьной арифметики до олимпиадной математики и физики. Использовались модели семейств Qwen и Mistral размером от 1,8 до 14 миллиардов параметров.

Результаты оказались впечатляющими. Модель Qwen-7B улучшила свои результаты на школьных задачах GSM8K с 65% до 75% правильных ответов. На сложных математических задачах MATH500 рост составил с 21% до 28%. И это без единого урока с учителем!

Особенно интересно, что метод работает лучше на больших моделях. Это логично – чтобы быть по-настоящему уверенным, нужно много «знать». Маленькая модель может быть уверена в чём угодно, а большая модель уверенность заслуживает.

Влияние уверенности на процесс обучения ИИ

Почему уверенность работает как компас

На первый взгляд идея кажется парадоксальной. Разве нельзя быть уверенно неправым? Конечно, можно. Но оказывается, у современных языковых моделей есть удивительное свойство: их уверенность часто коррелирует с правильностью.

Это немного напоминает капитана Джека Воробья из «Пиратов Карибского моря» с его магическим компасом. Компас показывает не север, а то, чего человек больше всего желает. Уверенность модели – это её внутренний компас, указывающий на наиболее логичные рассуждения.

Когда модель генерирует цепочку рассуждений и чувствует в ней логику и последовательность, её уверенность растёт. Когда рассуждение хаотично или противоречиво, уверенность падает. Поощряя уверенные рассуждения, мы фактически учим модель избегать логических ошибок.

Энтропия как показатель мыслительного хаоса ИИ

Энтропия как мера хаоса в «голове» ИИ

Энтропия – это научное название для беспорядка. В термодинамике она измеряет хаос в системе. В теории информации – неопределённость в данных. В нашем случае – сумятицу в «мыслях» модели.

Представьте модель, которая решает задачу «2+2=»?. Если она на 99% уверена, что ответ «4», энтропия низкая. Если она мечется между «4», «5» и «рыба», энтропия высокая. Минимизируя энтропию, мы учим модель думать более определённо и последовательно.

Это работает, потому что хорошие рассуждения обычно приводят к однозначным выводам. Когда вы правильно решаете уравнение, у вас получается конкретный ответ, а не размытое «что-то около пяти».

Сравнение метода RENT с аналогами

Сравнение с другими методами

Метод RENT сопоставим по эффективности с RLHF – обучением с подкреплением через обратную связь от человека. Это тот самый подход, который использовался для создания ChatGPT. Но RENT требует в разы меньше ресурсов, потому что не нужны армии аннотаторов.

По сравнению с простой выборкой лучших ответов, RENT даёт более стабильные улучшения. Выборка лучших ответов – это как рыбалка: закинул удочку, авось что-то поймается. RENT – это целенаправленная охота с компасом.

Ограничения метода обучения на уверенности

Ограничения: когда уверенность может подвести

Как и любой инструмент, RENT не панацея. У него есть свои «слепые зоны».

Во-первых, модель может быть уверенно неправой. Это как самоуверенный эксперт, который красиво рассказывает чушь. Особенно это опасно в областях, где у модели мало знаний.

Во-вторых, метод работает только для задач с многошаговыми рассуждениями. Для простых вопросов типа «столица Франции» он бесполезен.

В-третьих, некоторые задачи предполагают несколько равноправных ответов. В творческих задачах или этических дилеммах уверенность в одном варианте может быть вредной.

Значение метода для развития искусственного интеллекта

Что это значит для будущего ИИ

RENT открывает дверь к масштабируемому обучению ИИ без человеческого надзора. Это особенно важно для областей, где экспертная оценка дорога или невозможна.

Представьте исследование новых научных проблем, где правильные ответы ещё неизвестны. Или обучение ИИ для задач в экстремальных условиях, где люди не могут предоставить обратную связь. В таких случаях внутренняя уверенность модели может стать единственным доступным компасом.

Однако это не означает, что люди станут не нужны. Скорее, их роль сместится от постоянного контроля к стратегическому руководству. Люди будут задавать направление и цели, а ИИ научится самостоятельно находить пути к их достижению.

Доверие к внутренней интуиции ИИ

Заключение: доверие к интуиции машин

Идея поощрения ИИ за уверенность может показаться странной, но она отражает глубокую истину о природе интеллекта. Хорошие рассуждения часто ощущаются «правильными» ещё до формальной проверки. Учёные называют это интуицией, а в случае ИИ – внутренней уверенностью.

RENT показывает, что даже машины могут развить что-то похожее на интуицию. И эта машинная интуиция, как оказалось, довольно надёжный проводник к правильным ответам.

Конечно, как говорится в старой поговорке: «Доверяй, но проверяй». Уверенность ИИ – хороший ориентир, но не истина в последней инстанции. Баланс между автономией ИИ и человеческим контролем остаётся одной из ключевых задач на пути к по-настоящему умным машинам.

Оригинальное название: Maximizing Confidence Alone Improves Reasoning
Дата публикации статьи: 28 мая 2025
Авторы оригинальной статьи : Mihir Prabhudesai, Lili Chen, Alex Ippoliti, Katerina Fragkiadaki, Hao Liu, Deepak Pathak
Предыдущая статья Квантовый дирижёр: как флаксониум управляет симфонией света и материи Следующая статья Почему природа любит хаос, но работает как швейцарские часы?

Связанные публикации

Вам может быть интересно

Войти в Лабораторию

Исследование не заканчивается одним экспериментом. Ниже – публикации, которые развивают похожие методы, вопросы или концепции.

Новые модели RRM учатся рассуждать перед выставлением оценки, как умный учитель, который объясняет каждую отметку – и работают точнее обычных судей на 15-20%.

Доктор София Чен 22 мая 2025

Искусственный интеллект может ошибаться в оценке важности данных, когда часть информации систематически отсутствует – разбираемся, как это исправить.

Профессор Ларс Нильсен 7 июн 2025

От исследования к пониманию

Как создавался этот текст

Этот материал основан на реальном научном исследовании, а не сгенерирован «с нуля». В начале работы нейросети анализируют исходную публикацию: её цели, методы и выводы. Затем автор формирует связный текст, который сохраняет научный смысл, но переводит его из академического формата в ясное и читаемое изложение – без формул, но без потери точности.

Без жаргона

76%

Инженерная глубина

91%

Объяснение ошибок ИИ

78%

Нейросети, участвовавшие в работе

Мы показываем, какие модели использовались на каждом этапе – от анализа исследования до редакторской проверки и создания иллюстрации. Каждая нейросеть выполняет свою роль: одни работают с источником, другие – с формулировками и структурой, третьи – с визуальным образом. Это позволяет сохранить прозрачность процесса и доверие к результату.

1.
GPT-4-turbo OpenAI Резюмирование исследования Выделение ключевых идей и результатов

1. Резюмирование исследования

Выделение ключевых идей и результатов

GPT-4-turbo OpenAI
2.
Claude Sonnet 4 Anthropic Создание текста на основе резюме Преобразование резюме в связное объяснение

2. Создание текста на основе резюме

Преобразование резюме в связное объяснение

Claude Sonnet 4 Anthropic
3.
Phoenix 1.0 Leonardo AI Создание иллюстрации Генерация изображения по подготовленному промпту

3. Создание иллюстрации

Генерация изображения по подготовленному промпту

Phoenix 1.0 Leonardo AI

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться