Опубликовано

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Исследователи создали Medex – набор из 32,3 млн фактов о лекарствах из научной литературы, чтобы ИИ перестал предлагать токсичные молекулы.

Компьютерная наука
Leonardo Phoenix 1.0
Автор: Доктор София Чен Время чтения: 4 – 6 минут

Инженерная глубина

91%

Фокус на этике

82%

Культурная адаптация

87%
Оригинальное название: A Dataset for Distilling Knowledge Priors from Literature for Therapeutic Design
Дата публикации статьи: 14 авг 2025

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Представьте: вы просите умного помощника придумать новое лекарство от головной боли. Он выдаёт формулу, которая теоретически должна работать идеально – связывается с нужными рецепторами, проходит через биологические барьеры, выглядит многообещающе. Но есть одна маленькая проблема: эта молекула с вероятностью 60% вызывает мутации в ДНК.

Именно с такой проблемой столкнулись исследователи, когда проанализировали работу современных ИИ-систем для разработки лекарств. Оказалось, что искусственный интеллект, как студент-отличник, который зубрит формулы но никогда не ходил на практику, умеет решать математические задачи, но понятия не имеет о реальных опасностях.

Почему ИИ предлагает токсичные молекулы

Современные алгоритмы для поиска новых лекарств работают как очень умные, но наивные изобретатели. Они изучают миллионы химических структур, запоминают закономерности и пытаются создать что-то новое. Проблема в том, что эти системы учатся в основном на «сухих» данных – химических формулах, структурах белков, результатах тестов.

Но вся соль – в деталях, которые прячутся в научных статьях. Там написано: «соединение X показало многообещающие результаты, однако при длительном применении наблюдалось поражение печени» или «молекула Y эффективна против бактерий, но вызывает аллергические реакции у 15% пациентов».

Эти знания – как предупреждения на этикетках лекарств, которые ИИ просто не умеет читать. Результат? Системы генерируют молекулы, которые на бумаге выглядят отлично, но на практике могут быть опасны.

Проект Medex: учебник для ИИ-фармацевта

Чтобы решить эту проблему, команда исследователей создала Medex – гигантскую базу знаний, которая превращает миллионы научных текстов в понятные для ИИ факты. Представьте это как превращение библиотеки медицинских учебников в удобные карточки для запоминания.

Процесс создания Medex напоминает работу очень дотошного студента-медика:

Шаг 1: Сбор материала
Система просматривает научные базы данных – PubChem, UniProt, медицинские журналы – и находит статьи, где упоминаются лекарственные вещества, белки, гены и болезни.

Шаг 2: Выделение главного
Из каждой статьи ИИ вытаскивает конкретные факты: «Аспирин подавляет циклооксигеназу», «Морфин связывается с опиоидными рецепторами», «Пенициллин эффективен против стрептококков».

Шаг 3: Перевод на язык машин
Каждый факт связывается с химической формулой (в формате SMILES) или идентификатором белка. Получается что-то вроде: «молекула C₉H₈O₄ + факт: снижает воспаление».

В итоге получился набор из 32,3 миллиона таких пар «молекула-факт» – настоящая энциклопедия для ИИ-фармацевта.

Как проверяли эффект от «чтения учебников»

Исследователи протестировали свой подход на известном бенчмарке GuacaMol – наборе задач для оценки алгоритмов молекулярного дизайна. Это как экзамен для ИИ-систем: нужно придумать молекулы с определёнными свойствами.

Результаты до использования Medex были печальными:

  • Менее 10% предложенных молекул соответствовали критериям безопасности
  • При строгих требованиях по токсичности и биодоступности – 0% подходящих кандидатов

После «обучения» на Medex картина кардинально изменилась. ИИ-системы стали предлагать молекулы, которые не только работают по назначению, но и безопасны.

Три способа использования знаний

Команда разработала три разных архитектуры для работы с Medex, каждая – как разный тип студента:

MedexCLIP«визуал»
Эта модель одновременно «смотрит» на химическую структуру и «читает» текстовое описание. Как студент, который запоминает и картинку молекулы, и её описание из учебника.

MedexLLava«интегратор»
Продвинутая языковая модель, которая может «переваривать» и текст, и химические структуры в едином потоке мышления.

MedexLM«гуманитарий»
Работает только с текстовыми описаниями, но зато очень глубоко понимает связи между фактами.

Результаты: Давид против Голиафа

Самое впечатляющее в результатах – компактная модель с 15 миллионами параметров, обученная на Medex, превзошла гиганта TxGemma с 2 миллиардами параметров. Это как если бы студент первого курса, хорошо подготовившись, обошёл на экзамене аспиранта.

В задачах предсказания токсичности, проницаемости через гематоэнцефалический барьер и других ключевых характеристик лекарств, «маленькие» модели с Medex показали улучшение на 74% по сравнению с базовыми версиями.

Что это значит для будущего

Medex решает фундаментальную проблему ИИ в медицине – отсутствие контекста. Раньше алгоритмы были как талантливые, но неопытные химики, которые умеют собирать молекулы, но не знают об их побочных эффектах.

Теперь у ИИ есть доступ к коллективному опыту тысяч исследователей, накопленному за десятилетия. Это не просто улучшение – это качественный скачок к системам, которые могут по-настоящему помочь в создании новых лекарств.

Ограничения и планы на будущее

Конечно, Medex – это только начало. У системы пока есть несколько важных ограничений:

Она не отслеживает, откуда взят каждый факт, и не оценивает надёжность источника. Как студент, который записал что-то важное, но забыл, из какого учебника.

Нет связей между фактами – система знает, что «аспирин снижает температуру» и «аспирин разжижает кровь», но не понимает, как эти эффекты связаны.

Исследователи планируют добавить в следующих версиях графовую структуру связей между фактами, систему оценки достоверности источников и расширить базу за счёт новых публикаций.

Заключение: ИИ учится быть осторожным

История с Medex показывает важный принцип: недостаточно научить ИИ быть умным – нужно научить его быть мудрым. Знание того, чего не стоит делать, часто важнее знания того, что можно сделать.

В разработке лекарств, где ошибка может стоить жизни, такая мудрость особенно ценна. Medex – это попытка передать ИИ не только знания, но и осторожность, накопленную поколениями учёных.

И кто знает – возможно, именно такой подход поможет ИИ стать настоящим помощником в поиске лекарств от болезней, которые мы пока не умеем лечить.

До свидания, и помните: даже самому умному ИИ нужны хорошие учебники!?

Авторы оригинальной статьи : Haydn Thomas Jones, Natalie Maus, Josh Magnus Ludan, Maggie Ziyu Huan, Jiaming Liang, Marcelo Der Torossian Torres, Jiatao Liang, Zachary Ives, Yoseph Barash, Cesar de la Fuente-Nunez, Jacob R. Gardner, Mark Yatskar
GPT-5
Claude Sonnet 4
Предыдущая статья Закрученные фотоны: новый способ заглянуть в сердце атома Следующая статья Можно ли проследить, как программируется детский мозг? История одного алгоритма

Статьи NeuraBooks рождаются
в диалоге человека и ИИ

Сервис GetAtom даст вам те же возможности: создавайте тексты, визуалы и аудио вместе с нейросетью – легко и вдохновляюще.

Создать свой контент

+ получить в подарок
100 атомов за регистрацию

Лаборатория

Вам может быть интересно

Перейти к статьям

Как научить робота делать всё что угодно – без единого урока

Представьте робота, который смотрит видео в интернете и учится на нём выполнять задачи – без инструкций и тренировок. Теперь это реальность.

Компьютерная наука

VChain: Когда ИИ учится видеть не кадры, а причины – как самба учит танцевать компьютер

Новый подход VChain учит видеогенераторы понимать логику событий через цепочку визуальных размышлений – как футболист предвидит траекторию мяча раньше удара.

Компьютерная наука

Как научить дрон понимать человеческую речь: от пикселя до полёта

Исследователи создали систему See, Point, Fly, которая позволяет дронам летать куда угодно по обычным словесным командам – без предварительного обучения и тонны данных.

Компьютерная наука

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться