Опубликовано

Когда алгоритмы учатся видеть рак: два подхода к диагностике лёгких

Сравниваем две технологии машинного обучения для поиска мутаций и стадий рака лёгких по КТ-снимкам – одна точнее находит генетические поломки, другая лучше работает с новыми данными.

Электротехника и системные науки
Автор публикации: Доктор Алексей Петров Время чтения: 4 – 5 минут

В Сибири мы привыкли к тому, что техника должна работать безотказно. При -40°C нет права на ошибку – либо система функционирует, либо люди остаются без тепла. Тот же принцип применим к медицинским технологиям: когда речь идёт о раке лёгких, который убивает 1,8 миллиона человек в год, алгоритмы должны работать точно и надёжно.

Недавно провёл анализ двух принципиально разных подходов к диагностике рака лёгких с помощью искусственного интеллекта. Результаты оказались неожиданными – каждая технология показала себя лучше в своей области.

Проблема, которую решаем

Рак лёгких коварен тем, что его часто обнаруживают слишком поздно. А для эффективного лечения нужно знать не только стадию болезни, но и какие именно гены «сломались» в опухоли. От этого зависит, какие препараты помогут пациенту.

Сейчас для получения генетической информации делают биопсию – берут кусочек опухоли через прокол или операцию. Процедура рискованная, особенно если пациент ослаблен. Поэтому учёные пытаются научить компьютеры «видеть» генетические мутации прямо на КТ-снимках.

Звучит как фантастика, но технологии радиогеномики уже показывают реальные результаты. Правда, подходов существует множество, и важно понимать, какой когда использовать.

Два противника на ринге

Для сравнения взял две принципиально разные технологии:

FMCIB+XGBoost – это как опытный рентгенолог, который всю жизнь смотрел именно на лёгкие. Система предварительно обучена на 11 тысячах медицинских снимков опухолей. Она знает, как выглядят КТ-изображения, понимает медицинскую специфику.

Dinov2+ABMIL – это универсал, который сначала изучил миллионы обычных фотографий из интернета, а потом переучился на медицинские задачи. Система использует технологию самообучения и механизм «внимания» – может фокусироваться на важных деталях изображения.

Проверял обе технологии на двух задачах: поиск мутаций в генах KRAS и EGFR (это важные «поломки», влияющие на лечение) и определение стадии рака.

Битва за точность: результаты испытаний

Поиск генетических мутаций

Здесь специализированная система FMCIB+XGBoost показала явное превосходство:

При поиске мутаций KRAS точность составила 84,6% против 77,3% у универсальной системы. Но главное различие – в способности находить положительные случаи. FMCIB правильно выявила 40,6% всех мутаций, а Dinov2 практически не смогла их обнаружить (0%).

С мутациями EGFR картина похожая: FMCIB достигла точности 88,3% и нашла почти половину всех мутаций (49,2%), в то время как Dinov2 снова показала нулевую чувствительность при точности 79,8%.

Это как сравнивать опытного сибирского механика, который всю жизнь чинил дизельные генераторы, с универсальным инженером. В экстремальных условиях опыт решает всё.

Определение стадии рака

А вот здесь произошёл неожиданный поворот. При работе с новыми, незнакомыми данными из другой клиники универсальная система Dinov2+ABMIL показала лучшие результаты:

Точность определения T-стадии (размер и распространение опухоли): 79,7% против 72,6% у специализированной системы. Система также лучше балансировала между выявлением всех случаев и избеганием ложных тревог.

При определении N-стадии (поражение лимфоузлов) Dinov2 тоже лидировала: 70,4% точности против 64,3%.

Практические выводы

После анализа результатов стало понятно: нет универсального решения. Каждая технология хороша для своих задач.

Для поиска генетических мутаций однозначно стоит использовать FMCIB+XGBoost. Система обучена на профильных медицинских данных и умеет выявлять тонкие особенности, связанные с генетическими «поломками». В клинической практике это означает возможность назначать таргетную терапию без биопсии.

Для определения стадии рака, особенно при работе с данными из разных клиник и регионов, лучше подходит Dinov2+ABMIL. Её способность адаптироваться к новым условиям делает систему более надёжной в реальной медицинской практике.

Что это значит для медицины

Результаты исследования показывают путь к созданию гибридных систем диагностики. Представьте: врач загружает КТ-снимок пациента в систему, которая автоматически определяет стадию рака с помощью универсального алгоритма, а затем проверяет наличие ключевых мутаций специализированной моделью.

Такой подход может существенно ускорить диагностику и снизить количество инвазивных процедур. Особенно это важно для отдалённых регионов, где доступ к специалистам ограничен.

Технологии должны работать не только в идеальных лабораторных условиях, но и в суровой реальности российской медицины – с разным оборудованием, различными протоколами съёмки, нехваткой времени у врачей.

Взгляд в будущее

Исследование подтверждает главный принцип: правильный выбор инструмента зависит от конкретной задачи. Как в инженерии – для каждой работы нужен свой инструмент.

Следующий шаг – создание интегрированных систем, которые будут автоматически выбирать оптимальный алгоритм в зависимости от поставленной задачи. Но до этого ещё предстоит решить множество технических проблем, связанных со стандартизацией данных и обеспечением надёжности систем.

Пока же важно понимать: искусственный интеллект в медицине – это не замена врачу, а мощный инструмент, который может сделать диагностику быстрее и точнее. Главное – правильно этим инструментом пользоваться.

Оригинальное название: Comparative Analysis of Machine Learning Models for Lung Cancer Mutation Detection and Staging Using 3D CT Scans
Дата публикации статьи: 28 мая 2025
Авторы оригинальной статьи : Yiheng Li, Francisco Carrillo-Perez, Mohammed Alawad, Olivier Gevaert
Предыдущая статья Почему ваша пенсия может оказаться галлюцинацией, или Как не проиграть игру в рулетку на 40 лет вперёд Следующая статья Квантовый апгрейд для лазеров: как научить свет быть запутанным

От исследования к пониманию

Как создавался этот текст

Этот материал основан на реальном научном исследовании, а не сгенерирован «с нуля». В начале работы нейросети анализируют исходную публикацию: её цели, методы и выводы. Затем автор формирует связный текст, который сохраняет научный смысл, но переводит его из академического формата в ясное и читаемое изложение – без формул, но без потери точности.

Склонность к полемике

88%

Инженерная практичность

96%

Применимость решений

93%

Нейросети, участвовавшие в работе

Мы показываем, какие модели использовались на каждом этапе – от анализа исследования до редакторской проверки и создания иллюстрации. Каждая нейросеть выполняет свою роль: одни работают с источником, другие – с формулировками и структурой, третьи – с визуальным образом. Это позволяет сохранить прозрачность процесса и доверие к результату.

1.
GPT-4-turbo OpenAI Резюмирование исследования Выделение ключевых идей и результатов

1. Резюмирование исследования

Выделение ключевых идей и результатов

GPT-4-turbo OpenAI
2.
Claude Sonnet 4 Anthropic Создание текста на основе резюме Преобразование резюме в связное объяснение

2. Создание текста на основе резюме

Преобразование резюме в связное объяснение

Claude Sonnet 4 Anthropic
3.
Phoenix 1.0 Leonardo AI Создание иллюстрации Генерация изображения по подготовленному промпту

3. Создание иллюстрации

Генерация изображения по подготовленному промпту

Phoenix 1.0 Leonardo AI

Лаборатория

Вам может быть интересно

Войти в Лабораторию

Здесь собраны материалы из «Лаборатории», которые продолжают разговор: смежные исследования, близкие методы или идеи, помогающие глубже понять тему.

Электротехника и системные науки

Когда каждая точка доступа становится локальным координатором, а не просто ретранслятором, сеть работает быстрее, не перегружая центр обработки данных.

Электротехника и системные науки

Новая схема распределения ресурсов позволяет сотовым сетям одновременно передавать данные и обнаруживать объекты, не жертвуя ни скоростью, ни точностью. Это открывает путь к интегрированным системам шестого поколения.

Электротехника и системные науки

Показываем на практике, что расширение диапазона OESCL даёт почти в 3 раза большую пропускную способность на 1000 км при росте энергии на бит всего на 48%.

Хотите глубже погрузиться в мир
нейротворчества?

Первыми узнавайте о новых книгах, статьях и экспериментах с ИИ
в нашем Telegram-канале!

Подписаться