В МГУ сократили затраты памяти при обучении моделей ИИ в 8 раз

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Ученые факультета ВМК представили новый метод совмещения медицинских изображений на основе нейронных операторов. Разработанная модель под названием FNOReg может обучаться на снимках пониженного разрешения, а применяться на исходном разрешении без потери точности, что критически важно для работы с большими объемами 3D-данных, например, при томографии головного мозга. Решение позволяет существенно экономить вычислительные ресурсы, не жертвуя точностью. 

Работа была представлена на конференции International Conference on Pattern Recognition (ICPR) и опубликована в журнале  Lecture Notes in Computer Science.

Совмещение и точное сопоставление серий медицинских снимков — одна из ключевых задач в современной медицинской диагностике. Это необходимо для отслеживания развития болезни, планирования операций и сравнения данных разных обследований. Однако классические математические методы требуют существенных вычислительных мощностей и тонкой ручной настройки, а современные нейросетевые подходы требуют большого количества видеопамяти, недоступного на стандартных рабочих персональных компьютерах. При этом при обучении на снимках меньшего разрешения, чем при использовании нейросети, такие модели теряют в точности. Авторами работы — студентом Никитой Дроздовым и старшим научным сотрудником лаборатории математических методов обработки изображений ВМК МГУ Дмитрием Сорокиным — было предложено решение данной проблемы.

Разработанная модель FNOReg основана на архитектуре Нейронного оператора Фурье (FNO). В отличие от обычных сверточных нейросетей, которые работают с локальными паттернами на изображении, FNOReg оперирует в частотной (Фурье) области. Это позволяет модели выделять глобальные закономерности и быть устойчивой к изменению разрешения входных данных. Исследователи усовершенствовали базовую архитектуру, добавив эффективные блоки для извлечения признаков и дополнительные соединения, что повысило стабильность обучения и качество результата.

Модель тестировали на публичном наборе данных OASIS-1, содержащем МРТ-снимки головного мозга. При обучении на изображениях полного разрешения FNOReg показала точность, сопоставимую с лучшими современными аналогами (VoxelMorph, TransMorph). Ключевой прорыв проявился, когда модели обучали на снимках, разрешение которых было уменьшено вдвое. Точность ведущих аналогов при этом падала на 24-25%, в то время как точность FNOReg снижалась незначительно — всего на 0.8% для 2D и на 2.7% для 3D-данных. Это означает, что модель можно эффективно обучать на сжатых данных, экономя до 75% видеопамяти GPU, а затем применять к снимкам высокого разрешения без потери качества.

«Наша разработка открывает путь к более эффективной обработке больших медицинских данных, особенно трехмерных. Исследователи смогут тратить меньше ресурсов на вычисления и в итоге получать более точные и плавные карты деформаций для совмещения снимков. Это важный шаг к внедрению сложных ИИ-методов в реальную клиническую практику», — отмечает старший научный сотрудник лаборатории математических методов обработки изображения Дмитрий Сорокин.

Исходный код модели FNOReg находится в открытом доступе, что позволит научному сообществу использовать и развивать эту технологию.

Информация предоставлена пресс-службой МГУ

Источник фото: ru.123rf.com


Источник: scientificrussia.ru

Комментарии: