Опубликовано

Можно ли научить искусственный интеллект создавать ферменты на заказ?

Учёные разработали систему EnzyControl, которая «учит» компьютер проектировать ферменты под конкретные молекулы – словно программировать биологические машины для выполнения нужных задач.

Биология и нейробиология
DeepSeek-V3
Leonardo Phoenix 1.0
Автор: Доктор Хуан Мендоса Время чтения: 10 – 15 минут

Образность и метафоры

89%

Любознательность

98%

Научная точность

92%
Оригинальное название: EnzyControl: Adding Functional and Substrate-Specific Control for Enzyme Backbone Generation
Дата публикации статьи: 29 окт 2025

Представьте, что вам нужно создать идеальный ключ для замка, который вы ещё никогда не видели. Причём этот ключ должен не просто открывать замок, а делать это с невероятной скоростью и точностью, миллионы раз подряд, не изнашиваясь. Звучит как задача из области фантастики? Но именно этим занимаются учёные, когда проектируют новые ферменты – молекулярные машины, которые управляют почти всеми химическими реакциями в живых организмах.

Зачем вообще создавать ферменты?

Ферменты – это природные катализаторы, биологические ускорители химических реакций. Без них жизнь в том виде, в каком мы её знаем, была бы невозможна. Каждую секунду в вашем теле миллиарды ферментов расщепляют пищу, копируют ДНК, борются с токсинами и выполняют тысячи других задач. Они настолько эффективны, что могут ускорять реакции в миллионы, а то и миллиарды раз! 🚀

Но что, если мы научимся создавать собственные ферменты под конкретные задачи? Представьте фермент, который превращает пластиковый мусор в биотопливо. Или молекулу, способную синтезировать сложнейшее лекарство за считаные минуты вместо месяцев химического синтеза. Или биологического «наноробота», уничтожающего раковые клетки, не трогая здоровые ткани.

Проблема в том, что создать такой фермент невероятно сложно. Это всё равно что попытаться написать программу на языке, в котором миллиарды букв, а правила грамматики определяются законами квантовой физики и термодинамики одновременно.

Почему обычные методы не работают?

До недавнего времени учёные пытались решить эту задачу тремя способами. Первый – это своего рода «молекулярная селекция»: берём существующий фермент и делаем в нём случайные изменения, надеясь, что одно из них улучшит его работу. Метод работает, но медленно, как если бы вы пытались улучшить автомобиль, случайным образом меняя болты в двигателе.

Второй подход – компьютерное моделирование. Мы просчитываем, как каждый атом в ферменте взаимодействует с целевой молекулой, используя законы физики. Точно, но невероятно затратно по времени. Смоделировать одну миллисекундную реакцию может потребовать недель расчётов на суперкомпьютере.

Третий путь – создание ферментов «с нуля», de novo дизайн. Мы берём известный активный центр – ту часть фермента, которая непосредственно выполняет химическую реакцию, – и пытаемся «упаковать» его в новую белковую структуру. Это как попытка встроить двигатель Ferrari в корпус фургона: теоретически возможно, но на практике часто получается нечто нефункциональное.

Главная проблема всех этих методов в том, что они не учитывают главное: фермент и его субстрат (та молекула, с которой он работает) – это единое целое. Они должны подходить друг другу, как детали пазла. Более того, это трёхмерный пазл, где важна не только форма, но и распределение электрических зарядов, гибкость структуры, даже то, как молекулы воды располагаются в активном центре.

Когда искусственный интеллект учится биологии

В последние годы в мире дизайна белков произошла революция. Появились нейронные сети, способные предсказывать трёхмерную структуру белка по его аминокислотной последовательности с точностью, сравнимой с экспериментальными методами. AlphaFold от DeepMind стал для биологии тем же, что iPhone для мобильной связи – не первым, но определяющим направление на десятилетия вперёд.

Затем появились генеративные модели – системы, которые не просто предсказывают структуру известных белков, а создают совершенно новые. RFdiffusion, FrameFlow, Chroma – эти системы могут «придумывать» белки, которых никогда не существовало в природе. Представьте программу, которая генерирует не картинки или тексты, а трёхмерные молекулярные конструкции, потенциально способные к жизни!

Но когда дело доходит до ферментов, даже эти продвинутые системы спотыкаются. Почему? Потому что они не понимают, для чего создаётся фермент. Они могут создать красивую, стабильную белковую структуру, но она будет бесполезна, если не сможет эффективно связываться с нужной молекулой и катализировать нужную реакцию.

Это всё равно что попросить архитектурный ИИ спроектировать здание, не объяснив, что это должен быть концертный зал с определённой акустикой. Вы получите красивое здание, но музыка в нём будет звучать отвратительно.

EnzyControl: когда ИИ начинает понимать химию

Группа исследователей решила изменить правила игры. Они создали систему под названием EnzyControl, которая работает принципиально иначе. Вместо того чтобы генерировать фермент, а потом проверять, работает ли он с нужным субстратом, новая система с самого начала «знает», для какой молекулы создаётся фермент.

Как это работает? Давайте используем аналогию с архитектурой. Представьте, что вы проектируете театр. Классический подход: сначала нарисовать красивое здание, а потом пытаться втиснуть в него сцену и зрительный зал. Подход EnzyControl: начать с требований к акустике, видимости, потокам зрителей, и уже на их основе создавать всю конструкцию здания.

В центре системы – три ключевых компонента. Первый – это базовая нейронная сеть, которая умеет создавать белковые структуры вокруг заданных каталитических центров. Эти центры – как фундамент здания, они должны оставаться на своих местах, потому что именно здесь происходит химическое волшебство.

Второй компонент – модуль под названием EnzyAdapter. Это лёгкая надстройка над основной сетью, которая «вплетает» информацию о субстрате в процесс генерации. Представьте себе переводчика, который не просто переводит слова, но и объясняет культурный контекст, делая коммуникацию по-настоящему эффективной. EnzyAdapter берёт химические свойства целевой молекулы – её форму, распределение зарядов, гибкость – и переводит это на язык, понятный системе, генерирующей белок.

Третий элемент – умная стратегия обучения в два этапа. Сначала система учится распознавать связи между субстратами и ферментами, не меняя базовую модель. Это как научить опытного повара работать с новым ингредиентом, не переучивая его основным навыкам готовки. Затем происходит тонкая настройка всей системы, позволяющая ей создавать действительно оптимальные структуры.

База данных, которой не хватало

Но даже самая умная нейронная сеть бесполезна без качественных данных для обучения. Это как пытаться научить кого-то готовить, используя только рецепты из кулинарных шоу, где половина ингредиентов заменена «волшебным соусом», а пропорции указаны как «на глаз».

Исследователи создали базу данных EnzyBind – коллекцию из более чем 11 тысяч пар «фермент-субстрат», взятых из реальных экспериментальных структур. Но это не просто набор молекулярных фотографий. Для каждого фермента определены консервативные каталитические участки – те остатки аминокислот, которые эволюция сохраняла миллионы лет, потому что они критически важны для функции.

Как это делалось? Учёные использовали множественное выравнивание последовательностей – технику, которая позволяет сравнить десятки и сотни родственных ферментов и найти, какие позиции остаются неизменными. Это как если бы вы собрали сотни рецептов борща от разных бабушек со всей страны и вычислили, какие ингредиенты присутствуют абсолютно везде – именно они и составляют суть блюда.

Эти аннотированные данные стали «учебником» для EnzyControl, позволив системе научиться не только создавать структуры, но и понимать, какие части этих структур являются функционально критическими.

Результаты, которые впечатляют

Теперь самое интересное: работает ли это на практике? Исследователи провели серию экспериментов, сравнивая EnzyControl с лучшими существующими методами дизайна ферментов. Результаты оказались впечатляющими.

Первая метрика – «дизайнируемость». Это доля созданных ферментов, которые действительно могут быть синтезированы и сложатся в правильную структуру. У EnzyControl этот показатель составил 71,6% – на 13% выше, чем у ближайшего конкурента. Для сравнения: если раньше из десяти спроектированных ферментов работали шесть, то теперь – семь. Может показаться небольшим улучшением, но в мире экспериментальной биологии, где синтез каждого кандидата стоит тысячи долларов и недели работы, это огромный прорыв.

Второй показатель – функциональная точность. Ферменты классифицируются по номенклатуре EC (Enzyme Commission), которая определяет, какую именно химическую реакцию катализирует фермент. EnzyControl правильно «угадывала» класс фермента в 50% случаев – на 10% лучше альтернатив. Это значит, что система не просто создаёт структурно правильные белки, но и понимает их химическую функцию.

Но самое впечатляющее – показатели каталитической эффективности. Константа kcat, которая характеризует, сколько молекул субстрата фермент может обработать за секунду, у ферментов, созданных EnzyControl, была на 15% выше. Энергия связывания с субстратом улучшилась в среднем на 10-12%. Это не просто цифры – это разница между ферментом, который работает в лаборатории, и ферментом, который может стать основой промышленного процесса.

Когда меньше значит больше

Один из неожиданных результатов: ферменты, созданные EnzyControl, оказались в среднем на 30% короче, чем у конкурирующих методов, при сохранении аналогичной или даже лучшей каталитической активности. Почему это важно?

В биотехнологии размер имеет значение. Чем короче белок, тем проще и дешевле его синтезировать. Бактерии или дрожжи, которые используются для производства, могут произвести больше копий короткого белка. Более компактная структура часто означает большую стабильность и устойчивость к денатурации.

Это напоминает принцип элегантного кода в программировании: лучший код – не тот, который делает задачу любыми средствами, а тот, который решает её минимальным количеством строк, сохраняя читаемость и эффективность.

Проверка на прочность

Но настоящий тест любой системы машинного обучения – способность работать с данными, которых она никогда не видела при обучении. Может ли EnzyControl создать фермент для совершенно нового субстрата? Или для класса реакций, которых не было в обучающей выборке?

Исследователи провели zero-shot тесты – попросили систему создать ферменты для молекул и реакций, которые не встречались в базе данных EnzyBind. Результаты оказались обнадёживающими: средняя энергия связывания для таких «невиданных» случаев составила около –7 ккал/моль, что сопоставимо с обучающими примерами.

Особенно показателен один кейс. Для известного фермента с идентификатором PDB 2cv3 EnzyControl создала альтернативный вариант, который связывался с субстратом на 51% сильнее и работал в восемь раз эффективнее, чем лучший результат, полученный методом RFDiffusion. Восемь раз! Представьте, что ваш автомобиль внезапно стал проезжать в восемь раз дальше на том же количестве топлива.

Что внутри чёрного ящика?

Один из принципов хорошей науки – понимать, почему что-то работает, а не только что оно делает. Исследователи провели серию тестов, отключая различные компоненты EnzyControl, чтобы понять, какие части системы действительно важны.

Когда они убрали модуль EnzyAdapter – тот самый «переводчик» между субстратом и ферментом – качество резко упало. Без него система возвращалась к созданию структурно красивых, но функционально неэффективных ферментов. Это подтвердило ключевую идею: субстрат должен быть частью процесса проектирования с самого начала, а не добавляться постфактум.

Когда отключили аннотации каталитических сайтов, полученных из множественного выравнивания, результаты стали ещё хуже. Оказывается, информация об эволюционно консервативных позициях критически важна – она задаёт функциональные «якоря», вокруг которых строится вся остальная структура.

Эти эксперименты показали, что успех EnzyControl – не случайность и не результат простого увеличения размера модели. Это следствие правильной архитектуры, где каждый компонент выполняет осмысленную роль.

Ограничения и будущее

Было бы нечестно не упомянуть ограничения. EnzyControl создаёт несколько менее разнообразные структуры, чем некоторые диффузионные модели. Это компромисс: система жертвует креативностью ради функциональности и надёжности. Иногда это правильный выбор – лучше иметь пять работающих дизайнов, чем двадцать «творческих», из которых работает только один.

Кроме того, система пока работает только с теми типами химических реакций и субстратов, которые хорошо представлены в базе данных. Это проблема курицы и яйца: чтобы создавать ферменты для экзотических реакций, нужны примеры таких ферментов, но если бы мы их имели, возможно, нам не нужен был бы ИИ для их дизайна.

Ещё одно ограничение – вычислительное. Хотя EnzyControl работает быстрее, чем полное молекулярное моделирование, создание и оценка каждого фермента всё ещё требует значительных ресурсов. Для широкого применения в индустрии нужны дальнейшие оптимизации.

Взгляд в будущее

Тем не менее, EnzyControl представляет важный шаг к будущему, где мы сможем проектировать ферменты так же рутинно, как сегодня пишем программы. Представьте мир, где:

Фармацевтические компании создают ферменты для синтеза сложных лекарств за дни вместо лет. Молекула, на разработку которой сейчас уходит десятилетие и миллиард долларов, может быть синтезирована биологически за месяцы и миллион долларов.

Биотопливные предприятия используют специализированные ферменты для эффективной переработки сельскохозяйственных отходов в этанол или дизель. Солома, древесная щепа, даже водоросли становятся сырьём для возобновляемой энергетики.

Медицина получает персонализированные ферментные терапии. Ваш организм не может расщеплять определённое вещество из-за генетической мутации? Мы создадим для вас фермент, который компенсирует этот дефект, адаптированный под ваши уникальные особенности.

Пищевая промышленность использует ферменты для создания продуктов с улучшенными вкусовыми и питательными свойствами без ГМО и химических добавок. Сыр без коров, мясо без животных, всё благодаря точно спроектированным биокатализаторам.

Природа как хакер

Возвращаясь к моей любимой идее: природа – самый гениальный хакер из всех существующих. За три с половиной миллиарда лет эволюции она перебрала немыслимое количество вариантов, отбирая и комбинируя удачные решения. Ферменты, которые работают в ваших клетках прямо сейчас, – это результат миллиардов итераций природного алгоритма оптимизации.

Но у нас есть преимущество, которого нет у эволюции: мы можем учиться на её решениях, понимать принципы, лежащие в их основе, и применять их целенаправленно. Мы не ждём миллионы лет случайных мутаций – мы используем вычислительные мощности, большие данные и искусственный интеллект, чтобы ускорить этот процесс в триллионы раз.

EnzyControl – это не просто ещё один инструмент биоинформатики. Это демонстрация того, что мы начинаем говорить на языке природы достаточно бегло, чтобы не только читать её код, но и писать собственный. Мы учимся быть соавторами великой книги жизни, добавляя новые главы, которые сама природа, возможно, никогда бы не написала.

И это только начало путешествия. Каждый спроектированный фермент – это новая страница в этой книге, новое свидетельство того, что граница между естественным и искусственным размывается. Возможно, через несколько десятилетий наши потомки будут смотреть на ферментный дизайн как на что-то обыденное, как мы сегодня смотрим на антибиотики или вакцины. Но для нас, живущих в эпоху этих открытий, каждый успех – это маленькое чудо, напоминающее, что наука – это не просто формулы и эксперименты.

Это способность взять хаос молекулярного мира и найти в нём порядок. Это мужество утверждать, что мы можем понять и улучшить даже то, что создавалось миллиарды лет. Это бесконечное любопытство, которое заставляет нас спрашивать не «почему это работает»?, а «как мы можем заставить это работать лучше»?.

До встречи на страницах великой книги жизни, которую мы только начинаем учиться читать и писать. 🧬

Авторы оригинальной статьи : Chao Song, Zhiyuan Liu, Han Huang, Liang Wang, Qiong Wang, Jianyu Shi, Hui Yu, Yihang Zhou, Yang Zhang
GPT-5
Claude Sonnet 4.5
Gemini 2.5 Pro
Предыдущая статья Как научить робота делать всё что угодно – без единого урока

Хотите научиться создавать тексты
так же, как мы?

Попробуйте инструменты GetAtom – нейросети для генерации статей, изображений и видео, которые становятся настоящими соавторами.

Попробовать

+ получить в подарок
100 атомов за регистрацию

Лаборатория

Вам может быть интересно

Перейти к статьям

Когда генома слишком много: как мы научились слышать шёпот мутаций в симфонии рака

Новая модель GenVarFormer предсказывает, как далёкие мутации меняют работу генов при раке, открывая путь к поиску истинных виновников болезни среди миллионов невинных свидетелей.

Биология и нейробиология

Можно ли перепрограммировать науку, как компьютерный код?

Научные базы данных напоминают библиотеки с единственным входом – достаточно одного сбоя, чтобы миллионы исследователей остались без доступа к знаниям.

Биология и нейробиология

Мозг, который учится без учителя: когда нейроны становятся поэтами памяти

Открытие показывает, как искусственные нейронные сети могут обучаться подобно живому мозгу – без строгих алгоритмов, создавая бесконечные симфонии воспоминаний.

Биология и нейробиология

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ в нашем Telegram-канале!

Подписаться