Опубликовано

Когда ИИ учится читать УЗИ: как машины помогают врачам не пропустить патологию

Разработана система FPDANet для автоматической классификации УЗИ плода с точностью 91% – технология, которая работает не хуже опытного врача.

Электротехника и системные науки
Leonardo Phoenix 1.0
Автор: Доктор Алексей Петров Время чтения: 5 – 7 минут

Применимость решений

93%

Реализм

95%

Международная вовлечённость

70%
Оригинальное название: FPDANet: A Multi-Section Classification Model for Intelligent Screening of Fetal Ultrasound
Дата публикации статьи: 6 июн 2025

Введение

В медицине есть задачи, где ошибка стоит слишком дорого. УЗИ-скрининг беременных – одна из них. Врач должен проанализировать более 50 различных проекций, каждая из которых может показать критически важную информацию о развитии плода. При этом качество изображений оставляет желать лучшего: низкий контраст, шумы, размытость. Все структуры выглядят похоже, особенно на ранних сроках.

Представьте: вы смотрите на чёрно-белое изображение, где нужно различить десятки анатомических деталей размером в миллиметры. И от вашего заключения зависит здоровье будущего ребёнка. Неудивительно, что точность диагностики сильно зависит от опыта врача.

В Новосибирске зимой температура опускается до -40°C, но медицинское оборудование должно работать безотказно. Точно так же и системы искусственного интеллекта в медицине должны быть абсолютно надёжными. Нельзя позволить себе «почти работает» или «иногда ошибается».

Почему обычный ИИ не справляется с УЗИ

Большинство современных алгоритмов распознавания изображений создавались для обычных фотографий: кошек, собак, автомобилей. Там есть цвет, чёткие границы, привычные формы. УЗИ-изображения – это совершенно другой мир.

Традиционные нейросети типа ResNet работают по принципу «прямого прохода»: информация движется только в одном направлении, от простых признаков к сложным. Это как если бы врач смотрел на УЗИ только через увеличительное стекло, не видя общей картины.

В медицинских изображениях важен контекст. Одна и та же структура может означать норму или патологию в зависимости от того, что находится рядом, какой срок беременности, под каким углом сделан снимок. Обычные алгоритмы этого не учитывают.

Решение: FPDANet – ИИ с медицинским мышлением

Новая система FPDANet работает принципиально по-другому. Она не просто распознаёт изображения – она анализирует их как опытный врач.

Трёхуровневая архитектура

Базовый уровень использует проверенную сеть ResNet для извлечения основных признаков. Это фундамент, который должен быть надёжным как сибирская электросеть.

Модуль внимания DAN работает как фокусировка взгляда врача. Он учится концентрироваться на важных деталях и игнорировать шумы. Система анализирует каждый пиксель не изолированно, а в связи с остальными частями изображения.

Двусторонняя интеграция FPAN – это самое интересное. Информация движется в двух направлениях одновременно:

  • Снизу вверх: детали складываются в общую картину
  • Сверху вниз: общее понимание помогает лучше интерпретировать детали

Это похоже на то, как работает опытный врач: он одновременно видит и мелкие особенности, и общую клиническую картину.

Механизм внимания: как ИИ учится концентрироваться

Представьте, что вы смотрите на зашумленное изображение и пытаетесь найти важную деталь. Ваш мозг автоматически фокусируется на наиболее информативных областях. Именно это делает модуль DAN.

Система использует два типа внимания:

  • Пространственное – определяет, какие области изображения наиболее важны
  • Канальное – выбирает, какие характеристики изображения несут максимум информации

Математически это реализуется через специальные функции, которые «взвешивают» важность каждого элемента. Система учится этим весам в процессе обучения на тысячах размеченных изображений.

Испытания в боевых условиях

Данные для обучения

Для тестирования собрали базу из 9099 УЗИ-изображений в 21 различной проекции. Съёмка проводилась на сроках от 14 до 28 недель – именно тогда, когда скрининг наиболее информативен. Каждое изображение размечено квалифицированными врачами.

База включала разные типы исследований:

  • Двумерные изображения (классическое УЗИ)
  • Цветовое допплеровское картирование (оценка кровотока)
  • Спектральная допплерография (детальный анализ сосудов)

Вычислительная мощность

Обучение проводилось на серьёзном железе:

  • 4 видеокарты NVIDIA A100
  • Процессор Intel Xeon Platinum
  • 200 эпох обучения

Это как если бы система «пересматривала» все изображения 200 раз, каждый раз становясь точнее.

Результаты: цифры, которые впечатляют

FPDANet показала результат 91,05% точности при анализе одного наиболее вероятного диагноза (Top-1). Если рассматривать пять наиболее вероятных вариантов (Top-5), точность составила 100%.

Для сравнения:

  • Обычная ResNet18: 82,86%
  • Популярная VGG16: 85,48%
  • Современный Conformer: 88,54%

Разница в 3-8% может показаться небольшой, но в медицине каждый процент – это сотни правильно поставленных диагнозов.

Анализ ошибок

Особенно важно, что система показала минимальное количество ложноотрицательных результатов. Это значит, что она практически не пропускает патологию, принимая её за норму. В медицинском скрининге лучше перебдеть, чем недобдеть.

Практическое применение

Помощь врачам

Система не заменяет врача, а помогает ему. Она может:

  • Предварительно отсортировать изображения по степени подозрительности
  • Указать на области, требующие особого внимания
  • Предложить дифференциальный диагноз

Врач получает не просто «да» или «нет», а развёрнутый анализ с указанием степени уверенности системы.

Снижение нагрузки

В условиях нехватки квалифицированных кадров такая система может существенно повысить пропускную способность медицинских центров. Молодые врачи получают «второе мнение» от ИИ, что снижает риск ошибок.

Стандартизация качества

Система всегда работает одинаково хорошо, независимо от времени суток, усталости или настроения. Это особенно важно в регионах, где может не быть врачей высшей категории.

Ограничения и перспективы

Что нужно учитывать

Система обучалась на конкретной выборке пациентов и оборудовании. При внедрении в других клиниках может потребоваться дополнительная калибровка.

УЗИ-изображения сильно зависят от настроек аппарата, опыта сонографиста, особенностей пациента. Система должна быть достаточно устойчивой к этим вариациям.

Развитие технологии

Следующие шаги могут включать:

  • Расширение базы данных для повышения обобщающей способности
  • Интеграцию с другими медицинскими данными (анализы, анамнез)
  • Разработку объяснимых алгоритмов, которые могут показать, почему принято то или иное решение

Заключение

FPDANet демонстрирует, что современный ИИ может стать надёжным помощником в медицинской диагностике. Точность 91% при анализе УЗИ плода – это уровень, сопоставимый с работой опытного специалиста.

Технология доказала свою эффективность в лабораторных условиях. Теперь предстоит самое важное: адаптация к реальной клинической практике. Только когда система будет стабильно работать в условиях обычной поликлиники, с разным оборудованием и нагрузкой, можно будет говорить о настоящем прорыве.

В медицине, как и в энергетике, главное – надёжность. Красивые цифры в лаборатории ничего не стоят, если система даёт сбой в критический момент. FPDANet делает важный шаг к созданию по-настоящему работающих медицинских ИИ-систем.

Авторы оригинальной статьи : Minglang Chen, Jie He, Caixu Xu, Bocheng Liang, Shengli Li, Guannan He, Xiongjie Tao
GPT-4-turbo
Claude Sonnet 4
Предыдущая статья Когда нейроны учат биржу скакать: как искусственный разум переписывает правила оценки опционов Следующая статья Кинематика через призму Тейлора: как математика объясняет движение

Статьи NeuraBooks рождаются
в диалоге человека и ИИ

Сервис GetAtom даст вам те же возможности: создавайте тексты, визуалы и аудио вместе с нейросетью – легко и вдохновляюще.

Создать свой контент

+ получить в подарок
100 атомов за регистрацию

Лаборатория

Вам может быть интересно

Перейти к статьям

Как научить нейросеть играть на гитаре: от чистого звука до дисторшна за 5 секунд

Инженерный взгляд на технологию плавного перехода между гитарными эффектами через нейросети – от математики сферической интерполяции до практического применения в -40°C.

Электротехника и системные науки

Как научить компьютер переводить МРТ в КТ: нейросети, которые видят кости там, где их не должно быть

Новая нейросетевая архитектура превращает МРТ и конусно-лучевую томографию в качественные КТ-снимки – так, чтобы врачи могли точнее планировать лучевую терапию.

Электротехника и системные науки

Как заставить литиевую батарею рассказать правду о себе: новый метод изучения аккумуляторов на ходу

Сибирские инженеры разработали способ изучать внутреннее устройство литиевых аккумуляторов прямо во время их работы, не разбирая и не останавливая.

Электротехника и системные науки

Не пропустите ни одного эксперимента!

Подпишитесь на Telegram-канал –
там мы регулярно публикуем анонсы новых книг, статей и интервью.

Подписаться