Опубликовано 28 февраля 2026

Как ученые используют ИИ инструменты: анализ 250 000 реальных запросов

Как учёные на самом деле работают с ИИ-инструментами: анализ 250 000 реальных запросов

Исследователи из Allen AI проанализировали 250 000 запросов к научным ИИ-инструментам и выяснили, как учёные взаимодействуют с ними в действительности.

Исследования 4 – 6 минут чтения
Источник события: Ai2 4 – 6 минут чтения

Когда компании выпускают ИИ-инструменты для науки, они обычно рассказывают об их возможностях: что система умеет, какие задачи решает, насколько она точна. Однако вопрос о том, как учёные на самом деле используют эти инструменты в повседневной работе, остаётся без ответа. Специалисты из Allen AI решили разобраться в этом и опубликовали анализ более 250 000 реальных запросов к своим научным ИИ-инструментам.

Откуда данные и почему это важно

Allen AI – некоммерческая исследовательская лаборатория, которая разрабатывает ИИ-инструменты специально для научного сообщества. Среди них – Semantic Scholar (поисковик по научным статьям) и несколько специализированных сервисов, помогающих исследователям работать с литературой.

Набор данных, который они назвали ASTA (Academic Search and Task Analysis), охватывает запросы реальных пользователей – учёных, студентов, аналитиков. Проще говоря, это не синтетические данные и не лабораторные тесты: это то, что люди действительно вводили, когда им нужна была помощь с научными текстами.

Почему это ценно? Потому что разработчики ИИ-инструментов часто строят системы, исходя из предположений о том, как ими будут пользоваться. А реальность нередко оказывается иной. Анализ реальных запросов – способ сверить ожидания с действительностью.

Какие запросы пользователи задают ИИ-инструментам

Что люди на самом деле спрашивают

Первое, что бросается в глаза: большинство запросов не выглядят как поисковые фразы, например, «найди статью про X». Люди формулируют задачи – развёрнуто, с контекстом, иногда почти как письмо коллеге.

Исследователи выделили несколько основных типов взаимодействия:

  • Поиск литературы – найти работы по теме, часто с конкретными условиями: временной период, методология, область применения.
  • Понимание и объяснение«объясни, что значит этот термин», «в чём разница между этими подходами», «кратко изложи суть статьи».
  • Сравнение и синтез«как разные исследователи подходят к этой проблеме», «что говорит литература по этому вопросу в целом».
  • Помощь с написанием – формулировки, структура, поиск подходящих цитат.

Это важное наблюдение: люди воспринимают научные ИИ-инструменты не как поисковики, а скорее как думающего ассистента, которому можно объяснить задачу и получить осмысленный ответ. Разница принципиальная – и она влияет на то, как нужно строить такие системы.

Многосоставные запросы к ИИ системам

Запросы сложнее, чем кажется

Ещё один важный вывод: значительная часть запросов многосоставная. Пользователь не просто ищет статью – он хочет найти статью, понять её место в контексте области и получить краткое резюме. Всё за один раз.

Это создаёт реальную сложность для ИИ-систем. Обработать одиночный чёткий запрос – задача понятная. Но когда человек формулирует что-то вроде «покажи мне последние работы по теме X, объясни основные разногласия в этой области и помоги понять, стоит ли мне читать статью Y» – это уже целый набор подзадач, требующих разных навыков.

Судя по данным, именно такие комплексные запросы составляют заметную долю реального использования. А значит, инструменты, заточенные только под простой поиск, не закрывают реальные потребности учёных.

Целевая аудитория и сценарии использования ИИ в науке

Кто пользуется и как это выглядит на практике

Аудитория инструментов оказалась шире, чем можно было ожидать. Наряду с опытными исследователями активно пользуются системой студенты и люди, только входящие в новую для себя область знаний. Для них ИИ-инструмент часто становится первой точкой входа – способом быстро сориентироваться в незнакомой теме, прежде чем углубляться в чтение.

Это меняет угол зрения на то, для кого вообще делаются такие инструменты. Если раньше можно было предположить, что ими пользуются в основном эксперты, которым нужно быстро найти нужную статью, – реальность сложнее. Значительная часть пользователей находится в процессе обучения, и им нужна не просто выдача релевантных документов, а помощь в понимании.

Выводы для разработчиков научных ИИ-инструментов

Что это значит для разработчиков ИИ-инструментов

Allen AI публикует этот набор данных в открытом доступе – и это, пожалуй, главная практическая ценность публикации. Любая команда, которая разрабатывает инструменты для работы с научными текстами, теперь может опираться на реальные паттерны использования, а не строить гипотезы.

Выводы, которые здесь напрашиваются, довольно конкретны:

  • Инструменты должны уметь обрабатывать сложные, многосоставные запросы – не только простые поисковые фразы.
  • Объяснение и синтез – не дополнительные функции, а базовые потребности пользователей.
  • Значительная часть аудитории – не эксперты, а люди, которые только разбираются в теме. Интерфейс и логика ответов должны это учитывать.

Проще говоря: если делать научный ИИ-ассистент, исходя из того, как учёные реально с ним работают, – это один продукт. Если исходить из предположений – скорее всего, другой, и не факт что полезный.

Открытые вопросы исследования по использованию ИИ

Открытые вопросы

При всей ценности данных, у этого исследования есть естественные ограничения. Запросы собраны на конкретных платформах Allen AI – а значит, выборка отражает именно эту аудиторию и эти инструменты. Поведение пользователей других систем может отличаться.

Кроме того, анализ показывает что люди спрашивают, но не всегда объясняет почему именно так. Почему одни предпочитают развёрнутые запросы, а другие – короткие? Насколько формулировка зависит от привычки, интерфейса или предыдущего опыта с ИИ? Эти вопросы остаются открытыми.

Но даже с этими оговорками – иметь 250 000 реальных примеров того, как учёные взаимодействуют с ИИ, это уже значительно лучше, чем строить системы в условиях информационного вакуума. Такие данные постепенно смещают разработку от интуиции к доказательной базе – и это, пожалуй, именно то направление, в котором стоит двигаться.

Ссылка на публикацию: https://allenai.org/blog/asta-interaction-dataset
Оригинальное название: How do researchers actually use AI-powered science tools? Lessons from 250,000+ queries
Дата публикации: 27 фев 2026
Ai2 allenai.org Американский исследовательский институт, занимающийся разработкой языковых моделей и ИИ-систем для науки и образования.
Предыдущая статья Mercury 2: диффузионные языковые модели получили серьёзное обновление Следующая статья Мгновенное обновление нейросети: как Doc-to-LoRA и Text-to-LoRA меняют правила игры

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Теперь ИИ-агент Oracle Health может не только фиксировать содержание визита, но и формировать черновики врачебных назначений на основе беседы с пациентом.

Oraclewww.oracle.com 9 фев 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться