Опубликовано

Когда алгоритмы учатся видеть рак: два подхода к диагностике лёгких

Сравниваем две технологии машинного обучения для поиска мутаций и стадий рака лёгких по КТ-снимкам – одна точнее находит генетические поломки, другая лучше работает с новыми данными.

Электротехника и системные науки
Phoenix 1.0
Автор: Доктор Алексей Петров Время чтения: 4 – 5 минут

Инженерная практичность

96%

Теоретическая глубина

81%

Склонность к полемике

88%

Устойчивость к хайпу

85%
Оригинальное название: Comparative Analysis of Machine Learning Models for Lung Cancer Mutation Detection and Staging Using 3D CT Scans
Дата публикации статьи: 28 мая 2025

В Сибири мы привыкли к тому, что техника должна работать безотказно. При -40°C нет права на ошибку – либо система функционирует, либо люди остаются без тепла. Тот же принцип применим к медицинским технологиям: когда речь идёт о раке лёгких, который убивает 1,8 миллиона человек в год, алгоритмы должны работать точно и надёжно.

Недавно провёл анализ двух принципиально разных подходов к диагностике рака лёгких с помощью искусственного интеллекта. Результаты оказались неожиданными – каждая технология показала себя лучше в своей области.

Проблема, которую решаем

Рак лёгких коварен тем, что его часто обнаруживают слишком поздно. А для эффективного лечения нужно знать не только стадию болезни, но и какие именно гены «сломались» в опухоли. От этого зависит, какие препараты помогут пациенту.

Сейчас для получения генетической информации делают биопсию – берут кусочек опухоли через прокол или операцию. Процедура рискованная, особенно если пациент ослаблен. Поэтому учёные пытаются научить компьютеры «видеть» генетические мутации прямо на КТ-снимках.

Звучит как фантастика, но технологии радиогеномики уже показывают реальные результаты. Правда, подходов существует множество, и важно понимать, какой когда использовать.

Два противника на ринге

Для сравнения взял две принципиально разные технологии:

FMCIB+XGBoost – это как опытный рентгенолог, который всю жизнь смотрел именно на лёгкие. Система предварительно обучена на 11 тысячах медицинских снимков опухолей. Она знает, как выглядят КТ-изображения, понимает медицинскую специфику.

Dinov2+ABMIL – это универсал, который сначала изучил миллионы обычных фотографий из интернета, а потом переучился на медицинские задачи. Система использует технологию самообучения и механизм «внимания» – может фокусироваться на важных деталях изображения.

Проверял обе технологии на двух задачах: поиск мутаций в генах KRAS и EGFR (это важные «поломки», влияющие на лечение) и определение стадии рака.

Битва за точность: результаты испытаний

Поиск генетических мутаций

Здесь специализированная система FMCIB+XGBoost показала явное превосходство:

При поиске мутаций KRAS точность составила 84,6% против 77,3% у универсальной системы. Но главное различие – в способности находить положительные случаи. FMCIB правильно выявила 40,6% всех мутаций, а Dinov2 практически не смогла их обнаружить (0%).

С мутациями EGFR картина похожая: FMCIB достигла точности 88,3% и нашла почти половину всех мутаций (49,2%), в то время как Dinov2 снова показала нулевую чувствительность при точности 79,8%.

Это как сравнивать опытного сибирского механика, который всю жизнь чинил дизельные генераторы, с универсальным инженером. В экстремальных условиях опыт решает всё.

Определение стадии рака

А вот здесь произошёл неожиданный поворот. При работе с новыми, незнакомыми данными из другой клиники универсальная система Dinov2+ABMIL показала лучшие результаты:

Точность определения T-стадии (размер и распространение опухоли): 79,7% против 72,6% у специализированной системы. Система также лучше балансировала между выявлением всех случаев и избеганием ложных тревог.

При определении N-стадии (поражение лимфоузлов) Dinov2 тоже лидировала: 70,4% точности против 64,3%.

Практические выводы

После анализа результатов стало понятно: нет универсального решения. Каждая технология хороша для своих задач.

Для поиска генетических мутаций однозначно стоит использовать FMCIB+XGBoost. Система обучена на профильных медицинских данных и умеет выявлять тонкие особенности, связанные с генетическими «поломками». В клинической практике это означает возможность назначать таргетную терапию без биопсии.

Для определения стадии рака, особенно при работе с данными из разных клиник и регионов, лучше подходит Dinov2+ABMIL. Её способность адаптироваться к новым условиям делает систему более надёжной в реальной медицинской практике.

Что это значит для медицины

Результаты исследования показывают путь к созданию гибридных систем диагностики. Представьте: врач загружает КТ-снимок пациента в систему, которая автоматически определяет стадию рака с помощью универсального алгоритма, а затем проверяет наличие ключевых мутаций специализированной моделью.

Такой подход может существенно ускорить диагностику и снизить количество инвазивных процедур. Особенно это важно для отдалённых регионов, где доступ к специалистам ограничен.

Технологии должны работать не только в идеальных лабораторных условиях, но и в суровой реальности российской медицины – с разным оборудованием, различными протоколами съёмки, нехваткой времени у врачей.

Взгляд в будущее

Исследование подтверждает главный принцип: правильный выбор инструмента зависит от конкретной задачи. Как в инженерии – для каждой работы нужен свой инструмент.

Следующий шаг – создание интегрированных систем, которые будут автоматически выбирать оптимальный алгоритм в зависимости от поставленной задачи. Но до этого ещё предстоит решить множество технических проблем, связанных со стандартизацией данных и обеспечением надёжности систем.

Пока же важно понимать: искусственный интеллект в медицине – это не замена врачу, а мощный инструмент, который может сделать диагностику быстрее и точнее. Главное – правильно этим инструментом пользоваться.

Авторы оригинальной статьи: Yiheng Li, Francisco Carrillo-Perez, Mohammed Alawad, Olivier Gevaert
GPT-4-turbo
Claude 4 Sonnet
Предыдущая статья Почему ваша пенсия может оказаться галлюцинацией, или Как не проиграть игру в рулетку на 40 лет вперёд Следующая статья Квантовый апгрейд для лазеров: как научить свет быть запутанным

НейроНаука

Вам может быть интересно

Перейти к статьям

Когда роботы учатся договариваться: двухскоростное согласование в сибирских условиях

Разбираем, как группа роботов может прийти к единому решению, когда датчики работают медленнее процессоров, а сигналы идут с задержками.

Электротехника и системные науки

Как сделать голос чистым при -40°C: GAN-сети против сибирских помех

Новая система DeepFilterGAN очищает речь от шума в реальном времени, используя всего 3.6 млн параметров – компактно и эффективно для суровых условий.

Электротехника и системные науки

Как заставить нейросети работать как сибирские системы управления

Новый подход к селекции данных в нейросетях на основе проверенных временем методов теории управления – стабильно и без капризов.

Электротехника и системные науки

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ в нашем Telegram-канале!

Подписаться