Опубликовано 14 марта 2026

Оценка неопределенности в ИИ: как модель сигнализирует о незнании

Неуверенность модели как сигнал: что происходит, когда ИИ сталкивается с незнакомым

Исследователи предложили новый способ измерять неуверенность ИИ-моделей – через «пробелы в признаках», которые помогают точнее понять, когда модели не стоит доверять.

Исследования 3 – 5 минут чтения
Источник события: Capital One 3 – 5 минут чтения

Когда мы пользуемся какой-либо системой на основе ИИ – будь то кредитный скоринг, медицинская диагностика или рекомендации – за кадром всегда стоит вопрос: насколько модель уверена в своём ответе? Это не праздное любопытство. Если модель ошибается, но при этом «думает», что права, последствия могут быть весьма ощутимыми.

Именно этой проблемой занимается целое направление исследований – оценка неопределённости (uncertainty estimation). И недавно на конференции ICLR была представлена работа, которая предлагает свежий взгляд на то, как эту неопределённость измерять.

Что значит неуверенность ИИ-модели

Что значит «модель не уверена»

Проще говоря, любая обученная модель знает мир только в рамках тех данных, на которых её обучили. Когда ей попадается что-то непохожее на всё, что она видела раньше, модель оказывается в слепой зоне. Иногда она всё равно выдаёт уверенный ответ – просто потому, что не умеет распознавать собственное незнание.

Задача исследователей – научить модель честно сигнализировать: «Я не очень понимаю, что передо мной». Для этого нужна какая-то метрика, которая бы отражала степень этой неопределённости.

Что такое пробелы в признаках модели

Пробелы в признаках – что это такое

В новой работе предлагается измерять неопределённость через так называемые пробелы в признаках (feature gaps). Интуиция здесь довольно понятная.

Когда модель обрабатывает входные данные, она внутри себя формирует некое «представление» об объекте – набор характеристик, по которым она его описывает. Если этот объект похож на то, что модель уже видела, её внутреннее представление будет плотным и насыщенным. Если объект незнакомый – в этом представлении появятся «дыры», пробелы.

Именно эти пробелы авторы предлагают использовать как меру неуверенности. Технически это формализуется через перекрёстную энтропию между тем распределением вероятностей, которое выдаёт модель, и «истинным» распределением, которое в реальности неизвестно. Звучит сложно, но суть проста: чем больше разрыв между тем, что модель «думает», и тем, что есть на самом деле, – тем выше неопределённость.

Зачем важна оценка неопределенности на практике

Почему это важно на практике

Хорошая метрика неопределённости – это не просто академический интерес. Она напрямую влияет на то, как ИИ-системы используются в чувствительных областях.

Представьте банк, который использует модель для оценки кредитоспособности. Если заявка поступает от человека с нестандартной финансовой историей – такой, какой модель никогда не встречала, – модели стоит сказать: «Я не уверена». Тогда решение можно передать живому специалисту. Без надёжной оценки неопределённости этого не происходит: модель просто выдаёт ответ, и никто не знает, насколько ему можно доверять.

То же самое касается медицины, страхования, систем безопасности – везде, где цена ошибки высока.

Новый подход к оценке неопределенности в ИИ

Что нового в этом подходе

Методов оценки неопределённости существует немало. Среди популярных – байесовские подходы, ансамблевые методы, когда несколько моделей «голосуют» за ответ, и другие техники. У каждого есть свои плюсы и минусы.

Подход через пробелы в признаках интересен тем, что он смотрит не на поведение модели снаружи, а на её внутреннее состояние. Это похоже на разницу между тем, чтобы спросить человека «Ты уверен?» и понаблюдать за тем, как он размышляет. Второй способ может дать более честную картину.

Кроме того, авторы дают этой неопределённости строгое математическое определение – через перекрёстную энтропию между предсказательным и истинным распределениями. Это позволяет не просто интуитивно чувствовать «что-то не так», а измерять это количественно.

Открытые вопросы в оценке неопределенности ИИ

Открытые вопросы

Как и любое исследование, эта работа не закрывает тему полностью. Одна из ключевых сложностей – «истинное распределение» данных в реальных задачах неизвестно. Это не просто техническая деталь: от того, насколько точно удаётся его аппроксимировать, зависит качество всей метрики.

Открытым остаётся и вопрос о том, как хорошо подход работает в разных типах задач – там, где данные очень разнородны или где граница между «знакомым» и «незнакомым» размыта.

Тем не менее сама постановка задачи – смотреть на неопределённость через внутренние пробелы модели – выглядит перспективно. Если подход подтвердит свою надёжность в более широких экспериментах, он может стать полезным инструментом для всех, кто строит системы, которым нужно не только давать ответы, но и понимать границы своих знаний.

Оригинальное название: Uncertainty as feature gaps
Дата публикации: 23 апр 2026
Capital One www.capitalone.com Американская финансово-технологическая корпорация, применяющая машинное обучение и исследования в области ИИ для развития банковских сервисов, анализа данных и автоматизации финансовых процессов.
Предыдущая статья Nacos 3.2 и защита от вредоносных ИИ-навыков: зачем предприятиям собственный реестр Следующая статья Компьютер с ИИ-агентом внутри: новый облик привычного ПК

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Новый метод позволяет автономным системам оставаться в безопасности, даже когда датчики «врут», а истинное положение робота скрыто за облаком шума и неточностей.

Доктор Ким Ли 30 янв 2026

Новый алгоритм PMATIC решает проблему, из-за которой малейшая неточность в вычислениях превращает сжатый файл в цифровой мусор, при этом без потери качества.

Профессор Ларс Нильсен 25 янв 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться