Опубликовано 27 августа 2025

ИИ и разработка лекарств: проблемы токсичности и обучение Medex

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Исследователи создали Medex – набор из 32,3 млн фактов о лекарствах из научной литературы, чтобы ИИ перестал предлагать токсичные молекулы.

Компьютерная наука 4 – 6 минут чтения

Автор публикации: Доктор София Чен 4 – 6 минут чтения

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Представьте: вы просите умного помощника придумать новое лекарство от головной боли. Он выдаёт формулу, которая теоретически должна работать идеально – связывается с нужными рецепторами, проходит через биологические барьеры, выглядит многообещающе. Но есть одна маленькая проблема: эта молекула с вероятностью 60% вызывает мутации в ДНК.

Именно с такой проблемой столкнулись исследователи, когда проанализировали работу современных ИИ-систем для разработки лекарств. Оказалось, что искусственный интеллект, как студент-отличник, который зубрит формулы но никогда не ходил на практику, умеет решать математические задачи, но понятия не имеет о реальных опасностях.

Почему ИИ генерирует токсичные молекулы

Почему ИИ предлагает токсичные молекулы

Современные алгоритмы для поиска новых лекарств работают как очень умные, но наивные изобретатели. Они изучают миллионы химических структур, запоминают закономерности и пытаются создать что-то новое. Проблема в том, что эти системы учатся в основном на «сухих» данных – химических формулах, структурах белков, результатах тестов.

Но вся соль – в деталях, которые прячутся в научных статьях. Там написано: «соединение X показало многообещающие результаты, однако при длительном применении наблюдалось поражение печени» или «молекула Y эффективна против бактерий, но вызывает аллергические реакции у 15% пациентов».

Эти знания – как предупреждения на этикетках лекарств, которые ИИ просто не умеет читать. Результат? Системы генерируют молекулы, которые на бумаге выглядят отлично, но на практике могут быть опасны.

Проект Medex: база знаний для ИИ в фармацевтике

Проект Medex: учебник для ИИ-фармацевта

Чтобы решить эту проблему, команда исследователей создала Medex – гигантскую базу знаний, которая превращает миллионы научных текстов в понятные для ИИ факты. Представьте это как превращение библиотеки медицинских учебников в удобные карточки для запоминания.

Процесс создания Medex напоминает работу очень дотошного студента-медика:

Шаг 1: Сбор материала
Система просматривает научные базы данных – PubChem, UniProt, медицинские журналы – и находит статьи, где упоминаются лекарственные вещества, белки, гены и болезни.

Шаг 2: Выделение главного
Из каждой статьи ИИ вытаскивает конкретные факты: «Аспирин подавляет циклооксигеназу», «Морфин связывается с опиоидными рецепторами», «Пенициллин эффективен против стрептококков».

Шаг 3: Перевод на язык машин
Каждый факт связывается с химической формулой (в формате SMILES) или идентификатором белка. Получается что-то вроде: «молекула C₉H₈O₄ + факт: снижает воспаление».

В итоге получился набор из 32,3 миллиона таких пар «молекула-факт» – настоящая энциклопедия для ИИ-фармацевта.

Как Medex улучшил безопасность создаваемых ИИ молекул

Как проверяли эффект от «чтения учебников»

Исследователи протестировали свой подход на известном бенчмарке GuacaMol – наборе задач для оценки алгоритмов молекулярного дизайна. Это как экзамен для ИИ-систем: нужно придумать молекулы с определёнными свойствами.

Результаты до использования Medex были печальными:

Менее 10% предложенных молекул соответствовали критериям безопасности
При строгих требованиях по токсичности и биодоступности – 0% подходящих кандидатов

После «обучения» на Medex картина кардинально изменилась. ИИ-системы стали предлагать молекулы, которые не только работают по назначению, но и безопасны.

Модели обработки знаний MedexCLIP, MedexLLava, MedexLM

Три способа использования знаний

Команда разработала три разных архитектуры для работы с Medex, каждая – как разный тип студента:

MedexCLIP – «визуал»
Эта модель одновременно «смотрит» на химическую структуру и «читает» текстовое описание. Как студент, который запоминает и картинку молекулы, и её описание из учебника.

MedexLLava – «интегратор»
Продвинутая языковая модель, которая может «переваривать» и текст, и химические структуры в едином потоке мышления.

MedexLM – «гуманитарий»
Работает только с текстовыми описаниями, но зато очень глубоко понимает связи между фактами.

Эффективность Medex: компактные модели превосходят гигантов

Результаты: Давид против Голиафа

Самое впечатляющее в результатах – компактная модель с 15 миллионами параметров, обученная на Medex, превзошла гиганта TxGemma с 2 миллиардами параметров. Это как если бы студент первого курса, хорошо подготовившись, обошёл на экзамене аспиранта.

В задачах предсказания токсичности, проницаемости через гематоэнцефалический барьер и других ключевых характеристик лекарств, «маленькие» модели с Medex показали улучшение на 74% по сравнению с базовыми версиями.

Значение Medex для будущего создания лекарств ИИ

Что это значит для будущего

Medex решает фундаментальную проблему ИИ в медицине – отсутствие контекста. Раньше алгоритмы были как талантливые, но неопытные химики, которые умеют собирать молекулы, но не знают об их побочных эффектах.

Теперь у ИИ есть доступ к коллективному опыту тысяч исследователей, накопленному за десятилетия. Это не просто улучшение – это качественный скачок к системам, которые могут по-настоящему помочь в создании новых лекарств.

Medex: текущие ограничения и дальнейшее развитие

Ограничения и планы на будущее

Конечно, Medex – это только начало. У системы пока есть несколько важных ограничений:

Она не отслеживает, откуда взят каждый факт, и не оценивает надёжность источника. Как студент, который записал что-то важное, но забыл, из какого учебника.

Нет связей между фактами – система знает, что «аспирин снижает температуру» и «аспирин разжижает кровь», но не понимает, как эти эффекты связаны.

Исследователи планируют добавить в следующих версиях графовую структуру связей между фактами, систему оценки достоверности источников и расширить базу за счёт новых публикаций.

ИИ учится осторожности и мудрости в разработке лекарств с Medex

Заключение: ИИ учится быть осторожным

История с Medex показывает важный принцип: недостаточно научить ИИ быть умным – нужно научить его быть мудрым. Знание того, чего не стоит делать, часто важнее знания того, что можно сделать.

В разработке лекарств, где ошибка может стоить жизни, такая мудрость особенно ценна. Medex – это попытка передать ИИ не только знания, но и осторожность, накопленную поколениями учёных.

И кто знает – возможно, именно такой подход поможет ИИ стать настоящим помощником в поиске лекарств от болезней, которые мы пока не умеем лечить.

До свидания, и помните: даже самому умному ИИ нужны хорошие учебники! ?

#технический контекст #исследовательский обзор #нейросети #развитие ии #этика ии #инженерия #биология #ии в медицине #молекулярный дизайн

Источник: https://arxiv.org/abs/2508.10899v1

Оригинальное название: A Dataset for Distilling Knowledge Priors from Literature for Therapeutic Design

Дата публикации статьи: 14 авг 2025

Авторы оригинальной статьи : Haydn Thomas Jones, Natalie Maus, Josh Magnus Ludan, Maggie Ziyu Huan, Jiaming Liang, Marcelo Der Torossian Torres, Jiatao Liang, Zachary Ives, Yoseph Barash, Cesar de la Fuente-Nunez, Jacob R. Gardner, Mark Yatskar

Доктор София Чен Открыть профиль

«ИИ – как ребёнок: он повторяет наши ошибки, но учится быстрее.»

Открыть профиль

Я инженер, которая любит объяснять сложное весело. Считаю, что хороший ИИ начинается с честного диалога о его границах.

Предыдущая статья Закрученные фотоны: новый способ заглянуть в сердце атома Следующая статья Можно ли проследить, как программируется детский мозг? История одного алгоритма

ИИ и разработка лекарств: проблемы токсичности и обучение Medex

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Почему ИИ генерирует токсичные молекулы

Проект Medex: база знаний для ИИ в фармацевтике

Как Medex улучшил безопасность создаваемых ИИ молекул

Модели обработки знаний MedexCLIP, MedexLLava, MedexLM

Эффективность Medex: компактные модели превосходят гигантов

Значение Medex для будущего создания лекарств ИИ

Medex: текущие ограничения и дальнейшее развитие

ИИ учится осторожности и мудрости в разработке лекарств с Medex

Связанные публикации

Как научить ИИ читать клетки: когда морфология встречается с генетикой

Как «прочитать» молекулярные рукопожатия: новая эра предсказания белковых связей

Как научить ИИ предсказывать рак при -40°C: История одного трансформера, который не боится пропусков в данных

От исследования к пониманию

Нейросети, участвовавшие в работе

1. Резюмирование исследования

2. Создание текста на основе резюме

3. Создание иллюстрации