Опубликовано 27 августа 2025

ИИ и разработка лекарств: проблемы токсичности и обучение Medex

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Исследователи создали Medex – набор из 32,3 млн фактов о лекарствах из научной литературы, чтобы ИИ перестал предлагать токсичные молекулы.

Компьютерная наука
Автор публикации: Доктор София Чен Время чтения: 4 – 6 минут

Когда ИИ изобретает смертельные лекарства – и как научить его читать учебники

Представьте: вы просите умного помощника придумать новое лекарство от головной боли. Он выдаёт формулу, которая теоретически должна работать идеально – связывается с нужными рецепторами, проходит через биологические барьеры, выглядит многообещающе. Но есть одна маленькая проблема: эта молекула с вероятностью 60% вызывает мутации в ДНК.

Именно с такой проблемой столкнулись исследователи, когда проанализировали работу современных ИИ-систем для разработки лекарств. Оказалось, что искусственный интеллект, как студент-отличник, который зубрит формулы но никогда не ходил на практику, умеет решать математические задачи, но понятия не имеет о реальных опасностях.

Почему ИИ генерирует токсичные молекулы

Почему ИИ предлагает токсичные молекулы

Современные алгоритмы для поиска новых лекарств работают как очень умные, но наивные изобретатели. Они изучают миллионы химических структур, запоминают закономерности и пытаются создать что-то новое. Проблема в том, что эти системы учатся в основном на «сухих» данных – химических формулах, структурах белков, результатах тестов.

Но вся соль – в деталях, которые прячутся в научных статьях. Там написано: «соединение X показало многообещающие результаты, однако при длительном применении наблюдалось поражение печени» или «молекула Y эффективна против бактерий, но вызывает аллергические реакции у 15% пациентов».

Эти знания – как предупреждения на этикетках лекарств, которые ИИ просто не умеет читать. Результат? Системы генерируют молекулы, которые на бумаге выглядят отлично, но на практике могут быть опасны.

Проект Medex: база знаний для ИИ в фармацевтике

Проект Medex: учебник для ИИ-фармацевта

Чтобы решить эту проблему, команда исследователей создала Medex – гигантскую базу знаний, которая превращает миллионы научных текстов в понятные для ИИ факты. Представьте это как превращение библиотеки медицинских учебников в удобные карточки для запоминания.

Процесс создания Medex напоминает работу очень дотошного студента-медика:

Шаг 1: Сбор материала
Система просматривает научные базы данных – PubChem, UniProt, медицинские журналы – и находит статьи, где упоминаются лекарственные вещества, белки, гены и болезни.

Шаг 2: Выделение главного
Из каждой статьи ИИ вытаскивает конкретные факты: «Аспирин подавляет циклооксигеназу», «Морфин связывается с опиоидными рецепторами», «Пенициллин эффективен против стрептококков».

Шаг 3: Перевод на язык машин
Каждый факт связывается с химической формулой (в формате SMILES) или идентификатором белка. Получается что-то вроде: «молекула C₉H₈O₄ + факт: снижает воспаление».

В итоге получился набор из 32,3 миллиона таких пар «молекула-факт» – настоящая энциклопедия для ИИ-фармацевта.

Как проверяли эффект от «чтения учебников»

Исследователи протестировали свой подход на известном бенчмарке GuacaMol – наборе задач для оценки алгоритмов молекулярного дизайна. Это как экзамен для ИИ-систем: нужно придумать молекулы с определёнными свойствами.

Результаты до использования Medex были печальными:

  • Менее 10% предложенных молекул соответствовали критериям безопасности
  • При строгих требованиях по токсичности и биодоступности – 0% подходящих кандидатов

После «обучения» на Medex картина кардинально изменилась. ИИ-системы стали предлагать молекулы, которые не только работают по назначению, но и безопасны.

Как Medex улучшил безопасность создаваемых ИИ молекул

Три способа использования знаний

Команда разработала три разных архитектуры для работы с Medex, каждая – как разный тип студента:

MedexCLIP«визуал»
Эта модель одновременно «смотрит» на химическую структуру и «читает» текстовое описание. Как студент, который запоминает и картинку молекулы, и её описание из учебника.

MedexLLava«интегратор»
Продвинутая языковая модель, которая может «переваривать» и текст, и химические структуры в едином потоке мышления.

MedexLM«гуманитарий»
Работает только с текстовыми описаниями, но зато очень глубоко понимает связи между фактами.

Модели обработки знаний MedexCLIP, MedexLLava, MedexLM

Результаты: Давид против Голиафа

Самое впечатляющее в результатах – компактная модель с 15 миллионами параметров, обученная на Medex, превзошла гиганта TxGemma с 2 миллиардами параметров. Это как если бы студент первого курса, хорошо подготовившись, обошёл на экзамене аспиранта.

В задачах предсказания токсичности, проницаемости через гематоэнцефалический барьер и других ключевых характеристик лекарств, «маленькие» модели с Medex показали улучшение на 74% по сравнению с базовыми версиями.

Эффективность Medex: компактные модели превосходят гигантов

Что это значит для будущего

Medex решает фундаментальную проблему ИИ в медицине – отсутствие контекста. Раньше алгоритмы были как талантливые, но неопытные химики, которые умеют собирать молекулы, но не знают об их побочных эффектах.

Теперь у ИИ есть доступ к коллективному опыту тысяч исследователей, накопленному за десятилетия. Это не просто улучшение – это качественный скачок к системам, которые могут по-настоящему помочь в создании новых лекарств.

Значение Medex для будущего создания лекарств ИИ

Ограничения и планы на будущее

Конечно, Medex – это только начало. У системы пока есть несколько важных ограничений:

Она не отслеживает, откуда взят каждый факт, и не оценивает надёжность источника. Как студент, который записал что-то важное, но забыл, из какого учебника.

Нет связей между фактами – система знает, что «аспирин снижает температуру» и «аспирин разжижает кровь», но не понимает, как эти эффекты связаны.

Исследователи планируют добавить в следующих версиях графовую структуру связей между фактами, систему оценки достоверности источников и расширить базу за счёт новых публикаций.

Medex: текущие ограничения и дальнейшее развитие

Заключение: ИИ учится быть осторожным

История с Medex показывает важный принцип: недостаточно научить ИИ быть умным – нужно научить его быть мудрым. Знание того, чего не стоит делать, часто важнее знания того, что можно сделать.

В разработке лекарств, где ошибка может стоить жизни, такая мудрость особенно ценна. Medex – это попытка передать ИИ не только знания, но и осторожность, накопленную поколениями учёных.

И кто знает – возможно, именно такой подход поможет ИИ стать настоящим помощником в поиске лекарств от болезней, которые мы пока не умеем лечить.

До свидания, и помните: даже самому умному ИИ нужны хорошие учебники! ?

#технический контекст #исследовательский обзор #нейросети #развитие ии #этика ии #инженерия #биология #молекулярный дизайн #ии в медицине
Оригинальное название: A Dataset for Distilling Knowledge Priors from Literature for Therapeutic Design
Дата публикации статьи: 14 авг 2025
Авторы оригинальной статьи : Haydn Thomas Jones, Natalie Maus, Josh Magnus Ludan, Maggie Ziyu Huan, Jiaming Liang, Marcelo Der Torossian Torres, Jiatao Liang, Zachary Ives, Yoseph Barash, Cesar de la Fuente-Nunez, Jacob R. Gardner, Mark Yatskar
Предыдущая статья Закрученные фотоны: новый способ заглянуть в сердце атома Следующая статья Можно ли проследить, как программируется детский мозг? История одного алгоритма

От исследования к пониманию

Как создавался этот текст

Этот материал основан на реальном научном исследовании, а не сгенерирован «с нуля». В начале работы нейросети анализируют исходную публикацию: её цели, методы и выводы. Затем автор формирует связный текст, который сохраняет научный смысл, но переводит его из академического формата в ясное и читаемое изложение – без формул, но без потери точности.

Инженерная глубина

91%

Фокус на этике

82%

Культурная адаптация

87%

Нейросети, участвовавшие в работе

Мы показываем, какие модели использовались на каждом этапе – от анализа исследования до редакторской проверки и создания иллюстрации. Каждая нейросеть выполняет свою роль: одни работают с источником, другие – с формулировками и структурой, третьи – с визуальным образом. Это позволяет сохранить прозрачность процесса и доверие к результату.

1.
GPT-5 OpenAI Резюмирование исследования Выделение ключевых идей и результатов

1. Резюмирование исследования

Выделение ключевых идей и результатов

GPT-5 OpenAI
2.
Claude Sonnet 4 Anthropic Создание текста на основе резюме Преобразование резюме в связное объяснение

2. Создание текста на основе резюме

Преобразование резюме в связное объяснение

Claude Sonnet 4 Anthropic
3.
Phoenix 1.0 Leonardo AI Создание иллюстрации Генерация изображения по подготовленному промпту

3. Создание иллюстрации

Генерация изображения по подготовленному промпту

Phoenix 1.0 Leonardo AI

Связанные публикации

Вам может быть интересно

Войти в Лабораторию

Исследование не заканчивается одним экспериментом. Ниже – публикации, которые развивают похожие методы, вопросы или концепции.

Исследователи научили нейросети извлекать биологические сигналы из изображений клеток и объединять их с генетическими данными для более точного анализа тканей.

Доктор Хуан Мендоса 7 авг 2025

Исследователи создали улучшенные алгоритмы для предсказания того, как белки «узнают» друг друга – словно научили компьютер читать молекулярные рукопожатия.

Доктор Хуан Мендоса 30 июн 2025

Разбираем impuTMAE – систему машинного обучения, которая учится предсказывать выживаемость онкобольных даже при неполных медицинских данных.

Доктор Алексей Петров 23 авг 2025

Хотите знать о новых
экспериментах первыми?

Подписывайтесь на наш Telegram-канал – там мы делимся всем самым
свежим и интересным из мира NeuraBooks.

Подписаться