Опубликовано 6 марта 2026

Точность распознавания названий лекарств ИИ в речи

Насколько точно ИИ распознаёт названия лекарств в речи

В статье исследуется точность ИИ-транскрибации фармацевтических названий, определяются модели, которые справляются лучше, и объясняется важность этого для медицины.

Медицина 4 – 6 минут чтения
Источник события: AssemblyAI 4 – 6 минут чтения

Представьте: врач надиктовывает назначение, медсестра фиксирует инструкции к выписке, фармацевт записывает рекомендации пациенту – и всё это посредством голосовых инструментов с автоматической расшифровкой речи. Звучит удобно, но что произойдёт, если система услышит «Хумира», а запишет нечто совершенно иное? В медицине подобная ошибка является не просто опечаткой.

Именно этим вопросом задались исследователи AssemblyAI: насколько точно современные системы распознавания речи справляются с фармацевтическими названиями? Результаты оказались неоднозначными и заслуживают внимания всех, кто работает на стыке медицины и технологий.

Сложность распознавания названий лекарств

Почему лекарства – это особый случай

Названия препаратов – одна из самых сложных категорий слов для любой системы распознавания речи. Они не подчиняются обычной логике языка: это искусственно созданные слова, нередко схожие по звучанию, но совершенно разные по действию. Спутать «Celebrex» и «Cerebyx» при записи легко, а ведь первый применяется при артрите, второй – противосудорожный препарат.

Добавьте к этому разнообразие акцентов, профессиональный жаргон, фоновый шум в клинике – и задача становится по-настоящему нетривиальной. Системы транскрибации обучались на огромных объёмах общего текста и речи, но фармацевтическая лексика в этих данных представлена слабо. Модель просто не «видела» эти слова достаточно часто, чтобы уверенно их воспроизводить.

Как исследовалась точность распознавания

Как проводилась проверка

Исследователи взяли 50 широко используемых фармацевтических препаратов – как торговые названия («Липитор», «Виагра», «Адерол»), так и непатентованные («аторвастатин», «силденафил», «амфетамин»). Для каждого названия записали аудиофрагменты в нескольких вариантах произношения и с различными условиями записи.

Затем эти записи прогнали через несколько популярных систем транскрибации. Точность измеряли по стандартной метрике – доле ошибочно распознанных слов. Проще говоря: сколько раз система написала не то, что было произнесено.

Дополнительно проверяли, помогает ли так называемый кастомный словарь – возможность заранее передать модели список специфических слов для учёта при расшифровке.

Результаты исследования точности распознавания

Что показало исследование

Общая картина такова: все протестированные системы допускали ошибки в названиях препаратов значительно чаще, чем в обычной речи. Однако разница между моделями оказалась существенной.

Лучший результат показала модель Best от AssemblyAI – она достигла точности около 80% для фармацевтических названий без каких-либо дополнительных настроек. Это заметно выше, чем у конкурентов в базовом режиме.

При использовании кастомного словаря точность модели выросла до 90% и выше. То есть, если заранее «подсказать» системе, какие слова могут встретиться, – она справляется значительно лучше.

Для сравнения: другие протестированные системы в базовом режиме показали точность от 40% до 60% на тех же данных. Это означает, что почти каждое второе название препарата могло быть распознано неверно.

Распознавание торговых и непатентованных названий

Торговые против непатентованных: есть ли разница

Да, и довольно заметная. Непатентованные (международные) названия – такие как «метформин» или «амоксициллин» – встречаются в текстах чаще, они более предсказуемы по структуре. Модели справляются с ними несколько лучше.

Торговые названия – «Зипрекса», «Нексиум», «Ксарелто» – куда более непредсказуемы. Они могут звучать как выдуманные слова, потому что, в общем-то, так и есть. Система распознавания речи, не встречавшая такое слово в обучающих данных, нередко подбирает ближайший по звучанию знакомый вариант. Иногда это просто смешно, иногда – опасно.

Важность проблемы распознавания лекарств ИИ

Почему это важно за пределами клиники

Медицина – очевидный контекст. Но фармацевтические названия встречаются и за её пределами: в страховых документах, телемедицинских консультациях, аудиозаписях фармацевтических представителей, учебных материалах, подкастах о здоровье.

Везде, где есть голосовой ввод или автоматическая расшифровка – есть риск ошибки в названии препарата. И чем выше ставки, тем важнее знать, насколько можно доверять системе.

Это не призыв отказаться от ИИ-транскрибации в медицинском контексте, а скорее напоминание: инструмент нужно выбирать осознанно, понимая его ограничения.

Что делать на практике с голосовой транскрибацией

Что с этим делать на практике

Если вы используете или планируете использовать голосовую транскрибацию в контексте, где встречаются названия препаратов, учтите несколько практических наблюдений из исследования:

  • Кастомный словарь работает. Если система поддерживает возможность передать список специфических терминов – используйте её, так как прирост точности значительный.
  • Базовая точность у разных систем сильно отличается. Не стоит выбирать инструмент вслепую – имеет смысл протестировать его именно на той лексике, которая вам важна.
  • Непатентованные названия распознаются надёжнее. Если есть выбор между торговым и международным названием при диктовке – второй вариант с большей вероятностью будет распознан верно.
  • Человеческая проверка остаётся важной. Даже 90% точности означает одну ошибку на десять слов. В медицинском документе это может быть критично.

Вопросы исследования точности распознавания

Открытый вопрос

Исследование охватывает 50 препаратов – это достаточно репрезентативная выборка, но далеко не весь фармацевтический словарь. Реальная клиническая среда куда богаче: редкие препараты, новые торговые названия, региональные варианты произношения, аббревиатуры.

Кроме того, тест проводился в относительно контролируемых условиях. Как поведут себя системы с реальными записями из шумной клиники, с усталым голосом дежурного врача или нестандартным акцентом – это отдельный вопрос, который исследование не закрывает.

Тем не менее, даже в таком виде работа даёт полезный ориентир: не все системы одинаковы, разрыв между лучшими и средними – существенный, и возможности тонкой настройки реально влияют на результат.

Если вы работаете с голосовыми данными в медицинской или фармацевтической среде – это исследование стоит держать в голове при выборе инструментов.

Оригинальное название: How accurate is AI transcription for pharmaceutical drug names?
Дата публикации: 4 мар 2026
AssemblyAI www.assemblyai.com Американская ИИ-компания, разрабатывающая модели распознавания и анализа речи, а также API-платформу для создания приложений на основе голосовых данных.
Предыдущая статья GPT-5.4 в Microsoft Foundry: модель для тех, кто хочет не просто планировать, а действовать Следующая статья Как сделать большую языковую модель меньше, не потеряв при этом качество

Связанные публикации

Вам может быть интересно

Перейти к другим событиям

События – лишь часть картины. Эти материалы помогают увидеть шире: контекст, последствия и идеи, стоящие за новостями.

Теперь ИИ-агент Oracle Health может не только фиксировать содержание визита, но и формировать черновики врачебных назначений на основе беседы с пациентом.

Oraclewww.oracle.com 9 фев 2026

От источника к разбору

Как создавался этот текст

Этот материал не является прямым пересказом исходной публикации. Сначала была отобрана сама новость – как событие, важное для понимания развития ИИ. Затем мы задали рамку обработки: что в тексте важно прояснить, какой контекст добавить и на чём сделать акцент. Это позволило превратить отдельный анонс или обновление в связный и осмысленный разбор.

Нейросети, участвовавшие в работе

Мы открыто показываем, какие модели использовались на разных этапах обработки. Каждая из них выполняла свою роль – анализ источника, переписывание, проверка и визуальная интерпретация. Такой подход позволяет сохранить прозрачность процесса и ясно показать, как именно технологии участвовали в создании материала.

1.
Claude Sonnet 4.6 Anthropic Анализ исходной публикации и написание текста Нейросеть изучает оригинальный материал и формирует связный текст

1. Анализ исходной публикации и написание текста

Нейросеть изучает оригинальный материал и формирует связный текст

Claude Sonnet 4.6 Anthropic
2.
Gemini 2.5 Flash Google DeepMind Проверка и правка текста Исправление ошибок, неточностей и спорных формулировок

2. Проверка и правка текста

Исправление ошибок, неточностей и спорных формулировок

Gemini 2.5 Flash Google DeepMind
3.
DeepSeek-V3.2 DeepSeek Подготовка описания для иллюстрации Генерация текстового промпта для визуальной модели

3. Подготовка описания для иллюстрации

Генерация текстового промпта для визуальной модели

DeepSeek-V3.2 DeepSeek
4.
FLUX.2 Pro Black Forest Labs Создание иллюстрации Генерация изображения по подготовленному промпту

4. Создание иллюстрации

Генерация изображения по подготовленному промпту

FLUX.2 Pro Black Forest Labs

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться