Глубокое обучение для раннего выявления патологических изменений в рентгеновских микроструктурах костей: случай остеоартроза

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Текстурные объекты предназначены для количественной оценки закономерностей пространственного распределения пикселей изображения в целях анализа и интерпретации изображений. Необъяснимые вариации в текстурных узорах часто приводят к неправильной интерпретации и нежелательным последствиям при анализе медицинских изображений. В данной работе мы исследуем способность методов машинного обучения (мл) проектировать рентгенологический тест остеоартроза (ОА) на ранней стадии, когда число случаев заболевания пациентов невелико. В наших экспериментах мы использовали рентгеновские снимки коленей высокого разрешения у пациентов, которые были идентифицированы с баллами Келлгрена–Лоуренса, прогрессирующими от 1. Существующие методы мл обеспечили ограниченную диагностическую точность, в то время как предложенный групповой метод обработки данных стратегии глубокого обучения значительно расширил диагностический тест. Сравнительные эксперименты показывают, что предложенная структура с использованием текстурных признаков на основе Зернике значительно повысила диагностическую точность в среднем на 11%. Это позволяет сделать вывод, что разработанная модель ранней диагностики ОА обеспечит более точные рентгенологические тесты, хотя при наличии большого количества случаев заболевания потребуется новое исследование.

Введение

Остеоартрит (ОА) является наиболее распространенным заболеванием опорно-двигательного аппарата и основной причиной инвалидности у пожилых людей. Это пятая по значимости причина инвалидности в странах с высоким уровнем дохода. Подсчитано, что в Великобритании ОА приводит к потере 200 лет жизни с поправкой на инвалидность на 100 000 человек. Для улучшения результатов лечения пациентов остро необходимы новые методы ранней диагностики ОА. Без надежной диагностики ОА новые методы лечения не могут быть разработаны и оценены1.

Рентгенологи могут выявить патологические изменения, связанные с ОА, анализируя рентгеновские снимки коленного сустава высокого разрешения. Как правило, эти изменения вызывают сужение суставного пространства и развитие костных шпор, что приводит к боли и нарушению движений у больных. Эти патологии диагностируются у пациентов с развившимися симптомами, такими как боли в суставах2,3,4 Однако на ранних стадиях небольшие патологические изменения в микроструктуре кости могут быть оценены с помощью технологии высокого разрешения, такой как МРТ, которая является дорогостоящей и малодоступной. Ожидается, что использование расширенного анализа изображений обеспечит экономически эффективные диагностические решения, способные обеспечить надежную оценку патологических изменений микроструктуры кости5,6,7,8,9,10.

Во многих случаях текстуры паттернов, существующих на изображениях, могут быть эффективно определены пространственными распределениями пикселей11,12. Оценки распределения пикселей позволяют количественно представить интересующие нас паттерны. Однако на практике проектируемые признаки могут быть неполными, несущественными или иметь необъяснимые вариации, которые влияют на точность и надежность интерпретации и поэтому могут вызвать нежелательные последствия13,14. Желаемые особенности текстуры должны быть способны представлять основные вариации распределения пикселей таким образом чтобы объяснить структурные изменения в интересующих паттернах12,15. В частности , для диагностики ОА были использованы рентгеновские дескрипторы текстур16,17,18,19. Однако текстурные характеристики еще не способны обеспечить точную, надежную и воспроизводимую диагностику, поскольку на результаты влияют такие технологические условия рентгеновского излучения, как модальность, экспозиция, размытие, увеличение и угол проекции. На результаты диагностики также влияют естественные различия в структуре костей между пациентами одной группы20.

Методы обработки изображений, такие как Фурье-и вейвлет-преобразования, также использовались для обнаружения ОА в рентгеновских изображениях21. В частности, комбинации радиологических признаков повысили точность обнаружения, хотя новые признаки трудно интерпретировать как маркеры. Диагностические значения комбинированных признаков были эмпирически проверены с использованием статистики Фишера-балла3.

Другой подход объединил матрицу серого уровня с 2-мерным фильтром Габора для поиска новых текстурных признаков, способных повысить точность обнаружения. Диагностические значения вновь сформированных признаков были также оценены эмпирическимпутем 15.

Ожидается, что разработанные функции обеспечат высокую диагностическую ценность при повороте изображений и их различных масштабах. Текстурные объекты, инвариантные к вращению, могут быть спроектированы с использованием ортогональных моментов Цернике. Требуемая инвариантность к масштабу изображения была получена с помощью регулярных геометрических моментов. Моменты Зернике высокого порядка были использованы для решения задач классификации изображений22,23.

Использование моментов Цернике для ранней диагностики ОА в рамках машинного обучения было предложено в нашей предыдущей работе24. Этот фреймворк эффективно изучил новые особенности текстуры на рентгеновских снимках коленного сустава с высоким разрешением. Хотя моменты Цернике были вычислительно эффективны для обеспечения требуемой инвариантности, все еще требуются дополнительные усилия для поиска новых радиологических маркеров, способных повысить точность обнаружения. Однако существующие методы машинного обучения все еще ограничены в предоставлении надежных решений25,26.

Точность диагностических методов особенно зависит от объема выборки пациентов, которые были собраны и клинически верифицированы для целей разработки диагностической модели. Важно отметить, что объем выборки пациентов, верифицированных на ранней стадии, как правило, невелик, в то время как сбор большого количества случаев является дорогостоящим и ресурсоемким. Наиболее точные результаты достигаются при разработке диагностических моделей с репрезентативным обучением, которое расширяет знания экспертов27,28 Однако на практике эксперты часто не могут определить оптимальную структуру, в рамках которой диагностическая модель могла бы быть разработана таким образом, чтобы обеспечить высокую точность. Репрезентативное обучение позволяет экспертам расширить свои знания путем разработки новых модельных структур и признаков, способных повысить точность диагностики.

Ранняя стратегия глубокого обучения известна как групповой метод обработки данных (GMDH), который был предложен для изучения моделей “оптимальной” сложности, необходимых для достижения максимальной точности прогнозирования и классификации29,30 В рамках структуры GMDH многослойная модель проектируется из ссылочных функций, которые имеют небольшое число аргументов. GMDH генерирует новый слой, в то время как производительность модели увеличивается. Такая стратегия итеративно увеличивает связность моделей и делает стратегию GMDH особенно эффективной для проектирования моделей на небольшом наборе данных. Нейронные сети типа GMDH были эффективно использованы для поиска решений медицинских проблем31,32,33. Структура GMDH была успешно использована в нашей предыдущей работе по классификации ЭЭГ34 а также на изучение особенностей ЭЭГ для биометрической идентификации35.

В данном исследовании мы стремимся расширить экспериментальные доказательства того, что предложенная структура GMDH значительно превосходит методы машинного обучения с точки зрения точности обнаружения патологических изменений в микроструктуре кости, связанных с ОА на ранних стадиях. Доказательства этому дают эксперименты с текстурными особенностями и такие методы, как случайный лес (RF), машины опорных векторов (SVM) и искусственные нейронные сети (ANN). Проведено сравнение с методиками, параметры которых были экспериментально оптимизированы. Сравнительные эксперименты проводились с особенностями Харалика и моментами Зернике. Поскольку число случаев заболевания пациентов в нашем исследовании было невелико, результаты сравнивались в рамках кросс-валидации leave-one-out. Мы также обсуждаем ограничения нашего исследования и, наконец, делаем вывод, что предложенная структура GMDH повысит точность рентгенологических заключений в аналогичных случаях ранней диагностики ОА.

Новизна нашего исследования заключается в следующем. Новые рентгенологические маркеры, основанные на моментах Цернике высокого порядка, используемые в рамках предложенной структуры ГМДГ, обеспечивают высокую чувствительность к патологическим изменениям, связанным с ОА, на ранней стадии, когда число случаев заболевания составляет 40, в том числе 20 здоровых и 20 пациентов, выявленных с риском развития ОА.

Остальная часть статьи построена следующим образом. Предлагаемая методика представления изображений и обучения нейронных сетей типа GMDH описана в разделе методы. В этом разделе также излагаются вторичные данные, использованные в нашем исследовании для экспериментальной проверки предложенного метода. В разделах "результаты и обсуждение" представлены результаты, полученные на основе полученных данных, и, наконец, изложены основные выводы, которые можно сделать из проведенного исследования.

Результаты

В этом разделе мы опишем основные результаты, полученные с использованием различных текстурных особенностей и методов машинного обучения на рентгеновских изображениях высокого разрешения, которые изложены в разделе Данные. Эксперименты проводились с особенностями Харалика и моментами Цернике, описанными в разделе методы.

Эксперименты по рентгеновским данным проводились с использованием методов машинного обучения, таких как RF, SVM, ANN и предложенная сеть типа GMDH. RF-это метод, основанный на бутстрапе, который может значительно повысить точность, используя, например, деревья классификации36. Эффективность вышеперечисленных методов была оптимизирована, как описано в разделе методы.

Основные результаты приведены в Таблице 1 Мы видим, что моменты Цернике обеспечивают лучшую точность, чем функции Харалика, для всех методов, используемых в нашем исследовании. Обратите внимание, что достоверность не может быть рассчитана в рамках кросс-валидации leave-one-out, используемой в нашем исследовании на небольших данных. Сеть типа GMDH превзошла RF, SVM и ANN для обоих типов текстурных объектов. По сравнению с двухвыборочным статистическим тестом Колмогорова-Смирнова (КС), используемым в разрезе данных, диагностическая точность была улучшена с 72,5 до 85% для латеральных изображений и с 67,5 до 77,5% для медиальных изображений.

Таблица 1 Характеристики сетей RF, SVM, ANN и GMDH-типа с использованием функций Haralick и Zernike.

Полноразмерный стол

На практике функции, используемые для разработки диагностической модели, часто вносят неравный вклад в диагностическую проблему. Анализ важности признаков позволяет по-новому взглянуть на диагностическое решение. Например, новая диагностическая модель может быть разработана без функции, вносящей слабый вклад. Для таких моделей, как RF и GMDH, важность функции может быть определена как частота ее использования в проектируемой модели. Рисунок 1 показана важность моментов Цернике, используемых в RF (серым цветом) и предлагаемой сети типа GMDH (черным цветом), по сравнению с 81 моментом, рассчитанным для порядка 16, которые расположены по возрастающему порядку. Мы можем видеть, что сеть GMDH использовала моменты более высокого порядка чаще, чем RF. Таким образом, можно сделать вывод, что моменты Цернике более высокого порядка более информативны для выявления ОА на ранних стадиях.

Рисунок 1

рис. 1

Важность моментов Зернике для РЧ и предлагаемой сети типа GMDH.

Обсуждение

Текстурные объекты используются для представления паттернов изображений, наблюдаемых в виде пространственных распределений пикселей. Необъяснимые вариации в текстурных особенностях приводят к неправильной интерпретации и нежелательным последствиям. На практике текстурные признаки могут в значительной степени варьироваться, что делает проблематичным проектирование информативных радиологических маркеров.

Указанные проблемы существенно влияют на точность ранней диагностики, когда патологические изменения у пациентов не могут быть достоверно выявлены в рамках стандартных обследований и объем данных, необходимых для разработки диагностического решения, ограничен. В нашей предыдущей работе24 решение этой проблемы было предложено в рамках структуры GMDH с использованием текстурных функций. Предложенное решение сравнивается с другими методами машинного обучения на пациентах, которые были ретроспективно верифицированы при риске развития ОА на рентгеновских снимках коленей высокого разрешения, доступных в национальном исследовании37,38. Ранние диагностические случаи ОА трудно поддаются клинической верификации, поскольку связанные с ними патологические изменения не могут быть достоверно обнаружены стандартным рентгенологическим исследованием, основанным на балле келлгрена Лоуренса39.

Наша предыдущая работа была расширена в части сравнения с методами машинного обучения, оптимизированными в ходе экспериментов. Сравнительные эксперименты проводились на рентгеновских снимках, представляющих случаи заболевания пациентов, в том числе новые случаи ОА на ранней стадии. Число случаев заболевания пациента было увеличено до 40, что все еще невелико. Для оценки диагностической точности была использована кросс-валидация leave-one-out, используемая в сравнительных экспериментах. Оценка доверительных интервалов требует больших массивов данных и поэтому выходит за рамки нашего исследования. Таким образом, основные выводы и понимание проблемы ранней диагностики ограничены и не могут быть непосредственно распространены на аналогичные случаи.

Первое наблюдение в наших экспериментах состояло в том, что статистический тест КС, примененный к изображениям в контрольной и контрольной группах, не может обеспечить высокую диагностическую точность. Предприняв подход, основанный на GMDH, мы исследовали текстурные особенности, основанные на ортогональных моментах Цернике, которые являются вычислительно эффективными и инвариантными к вращению и масштабированию изображения.

Второе наблюдение состояло в том, что особенности текстуры, основанные на моментах Цернике, не вносят столь же важного вклада в диагностическую задачу. Новые рентгенологические особенности, полученные на основе небольшого объема данных пациентов в рамках предложенной системы ГМДГ, повысили точность диагностики на ранних стадиях. Это происходит потому, что GMDH может итеративно увеличивать сложность сетевого подключения на каждом новом уровне, в то время как производительность сети увеличивается. В каждом слое генерируются новые объекты и выбираются те, которые обеспечивают наилучшее соответствие.

В наших экспериментах с текстурными особенностями мы использовали различные методы машинного обучения. Экспериментальные результаты показывают, что новые рентгенологические маркеры, основанные на моментах Цернике, которые были изучены в рамках предложенной структуры GMDH, значительно повысили диагностическую точность. По сравнению с исходным уровнем дискриминации на основе КС диагностическая точность была улучшена в среднем на 11%. Таким образом, мы приходим к выводу, что предложенный метод позволяет эффективно изучать новые текстурные особенности рентгеновских изображений высокого разрешения, которые способны повысить точность диагностики ОА на ранних стадиях.

Методы

Данные

В наших экспериментах мы использовали данные , собранные в национальном исследовании37,38, которое проводилось в соответствии с утвержденными этическими нормами и протоколами исследования. Эти данные включают в себя рентгеновские снимки коленей с высоким разрешением у испытуемых. Испытуемые, участвовавшие в исследовании, были здоровы или имели диагноз ОА. Образцы рентгеновских изображений , а также детали рентгеновской визуализации доступны у координаторов исследования37,38. Упомянутое исследование, в частности, предоставляет инструментальную информацию о рентгеновской визуализации, такую как: DX modality, Dexela Detector, 75?m

, 3072x1944

пиксельное разрешение, 14 бит серого уровня.

Случаи заболевания пациентов были ретроспективно проанализированы экспертами для выявления случаев, когда патологические изменения еще не развились, и их рентгенологические исследования, основанные на баллах келлгрена–Лоуренса (KL)39, были оценены как 1-я степень. Такие случаи были дополнительно исследованы с целью выявления лиц с развившейся ОА, подтвержденной обследованием КЛ на уровне выше или равном 2. Поскольку радиологическое исследование проводилось в течение заданного периода и определенной популяции, число пациентов, выявленных с прогрессирующими степенями КЛ, было невелико.

В группу случая (патологии) в нашем исследовании вошли 20 человек с риском развития ОА на ранней стадии. В контрольную группу вошли 20 человек, случайно отобранных из здоровой популяции. Изображения обеих групп были взяты из латерального и медиального отделов большеберцовой кости. Область интересов (ROI), необходимая для наших экспериментов, была автоматически выбрана с помощью метода, основанного на энтропии40. Другие методы сегментации изображений41,42,43 способны обеспечить ROI, выбранные из рентгеновских изображений коленного сустава высокого разрешения. Средний размер изображений ROI составлял 150 на 150 пикселей. ROI, которые были использованы в наших экспериментах, доступны по адресу https://doi.org/10.6084/m9.figshare.8303996 -да. На рис. 2 показаны распределения значений яркости на латеральном (слева) и медиальном (справа) изображениях случайной и контрольной групп, показанные красным и синим цветами соответственно. В таблице 2 приведены среднее значение и стандартное отклонение ?

яркости пикселей над контрольной и корпусной группами. Мы видим, что средняя яркость для группы изображений случая выше, чем у контрольной группы, как в латеральной, так и в медиальной областях. Это наблюдение можно объяснить увеличением плотности костной ткани у пациентов16-й группы.

Рисунок 2

рис. 2

Распределение значений яркости пикселей для боковых (левых) и медиальных (правых) изображений, контрольных (синих) и регистровых (красных).

Полноразмерное изображение

Таблица 2 Статистика яркости пикселей на латеральных и медиальных изображениях.

Полноразмерный стол

Принимая во внимание вышеизложенное, можно предположить, что распределения плотности яркости пикселей на изображениях контрольной и контрольной групп существенно различаются. Для проверки этой гипотезы определим распределения яркости изображений контрольной и случайной групп, C0

и С1 соответственно. Затем имея распределение изображения, Cx, мы можем использовать статистику KS с двумя выборками для проверки гипотезы H0, что образцы ix черпаются либо из населения C0 или население С1. P-значения, p0 и П1, рассчитываются для контрольной и случайной групп для проверки гипотезы H0 на заданном уровне значимости ?=0.05. Гипотеза H0 отклоняется, если оба p0 и П1 меньше, чем ?

В таком случае данный образ не может быть распознан между группами на данном уровне значимости.

Пусть статистика КС D0

и D1 - максимальные расстояния между эмпирическими функциями распределения, оцененными для изображения Ix а также Контрольная и случайная популяции C0 и С1 соответственно. Затем мы можем назначить изображение Ix к группе с минимальным расстоянием мин(D0,D1)

.

Приведенный выше алгоритм используется в нашем исследовании в качестве базового диагностического правила. В таблице 3 показана точность, полученная с помощью этой базовой KS-дискриминации на латеральном и медиальном типах изображений. Коэффициент отклонения, показанный в этой таблице, рассчитывается в процентах от изображений, для которых гипотеза H0

был отвергнут. При данном уровне значимости диагностические результаты были отклонены для 62,5% латеральных и 70,0% медиальных изображений.

Таблица 3 показатели эффективности и коэффициенты отклонения дискриминации на основе КС для латеральных и медиальных типов изображений.

Полноразмерный стол

Особенности текстуры

Haralick features11 основаны на пространственных зависимостях серого тона (Матрица встречаемости серого уровня), которые позволяют извлекать статистические характеристики между парами пикселей на изображении. Эти характеристики вычисляются вдоль направления и расстояния между парами пикселей. Матрица совпадений включает в себя контрастность и энтропию, рассчитанные для изображения. Контраст оценивает разницу между значениями серого уровня пикселей, в то время как энтропия измеряет случайность или однородность распределения пикселей по координатам изображения.

Следуя работе23, моменты Цернике представляют заданное изображение f(x, y) набором признаков, инвариантных к его положению, размеру, ориентации, а также к повороту и масштабу изображения. Искомые свойства задаются моментами m, которые представляют собой глобальную информацию об изображении:

mpq=?x?yxpyqf(x,y),

(1)

где mpq

является ли момент (p+q

)й порядок.

Вышеперечисленные моменты mpq

они не ортогональны и поэтому не могут быть эффективно вычислены. Полиномы цернике, которые являются ортогональными, обеспечивают эффективное вычисление функций. Моменты цернике вычисляются как ортогональные комплексные многочлены Vnm(x,y) который может быть переписан в пределах единичного круга x2+y2<=1

как:

Vnm(x,y)=Vnm(?,?)=Rnm(?)e(-jm?),

(2)

где n>=0

являются ли положительные целые числа, m-положительные или отрицательные целые числа, подчиняющиеся ограничениям: |m/<=n и Н-|м| есть даже, ? - длина вектора до пикселя (x, y), а ? это угол между осью xи вектором ?

.

The above Rxy

are the radial polynomials which are defined as:

Rnm=?k=0(n-|m|)/2(-1)k(n-k)!k!((n+|m|)/2-k)!((n-|m|)/2-k)!?n-2k.

(3)

Zernike moments Anm

are the projections of an image f(xy) onto the orthogonal polynomials Rnm

. The Zernike moment of order n with repetition m is

Anm=n+1??x?yf(x,y)V*nm(?,?).

(4)

Additional details of the Haralick features and Zernike moments used in our study are provided in the section Experimental Settings.

GMDH-type neural networks

Глубокое обучение типа GMDH, принятое в нашем исследовании, основано на эвристической оптимизации многослойных нейронных сетей с полиномиальной функцией активации. GMDH генерирует новые функции и наращивает сетевое подключение на основе заданных обучающих данных29 Эвристическая оптимизация основана на так называемых “внешних” критериях, направленных на выбор сетей, которые лучше всего подходят для обучающих данных, что позволяет GMDH эффективно предотвращать переоснащение сетей, что влияет на способность сети обобщать и прогнозировать невидимые данные. Новые объекты генерируются в каждом новом слое путем объединения входных переменных и выходов нейронов из предыдущих слоев. Количество слоев растет, а производительность сети увеличивается. Когда сетевая связность становится “оптимальной”, способность к обобщению достигает максимального значения, которое может быть достигнуто в рамках определенной функции активации и критериев выбора.

В сетях типа GMDH функции активации определяются как кратковременные полиномы,которые могут быть линейными или нелинейными, y=g(x;w)

, где x - входной вектор, а w - вектор коэффициентов. Используя заданную функцию активации g(x; w), GMDH генерирует новый вектор признаков x=(xi1,xi2) для K нейронов в слое r=1, с индексами i1?i2,i1=1,...,m, и где именно K=m(m-1)/2 - число попарных комбинаций для заданных m входных переменных. Выходы нейронов на r-м слое, yi

, записываются как

y(r)i=g(xi1,xi2;w^(r)i),i=1,...,K.

(5)

Задано множество индексов а, векторов коэффициентов w^(r)

приспособлены к данным [X(A) | y(A)] для каждого нейрона. Результаты численно стабильны так как количество выборок данных включенных в набор а больше чем количество переменных м и столбцов i1,i2 о матрице X(A,[i1,i2]) они не коррелируют. Таким образом, установленные веса w^

являются:

w^(r)=[1 X(A,[i1,i2])]-1y(A),

(6)

где 1 обозначает единичный вектор.

Имея выходы yi

по всем данным X, ошибки регуляризации ?

можно рассчитать следующим образом:

i=?yi-y?.

(7)

Ошибки сортируются в порядке возрастания, а затем для следующего слоя выбираются первые F нейронов с наименьшими ошибками. Нейроны с коррелированными выходами исключаются из выборки yi1,...,yiF

таким образом, число выделенных нейронов на r-м слое может быть Fr: 1<=Fr<=F Нейроны на следующих слоях r+1 генерируются путем применения функции активации g к расширенным данным Z(r)=[Y(r) | X], которые включают в себя выходы выбранных нейронов Y(r)=[yi1,...,yiFr] и входные данные X. Таким образом, матрица Z(r) содержит mr=Fr+m

столбцы.

Аналогично, векторы коэффициентов w^(r+1)

оцениваются для i1,i2 столбцы матрицы Z(r) Выходы нейронов y(r+1)

затем рассчитываются следующим образом:

y(r+1)i=g(z(r)i1,z(r)i2;w^(r+1)i),i=1,…,Kr,

(8)

где i1?i2;i1=1,...,mr,i2=1,...,mr

, и Kr=mr(mr-1)/2 - это число попарных комбинаций для мр

столбцы.

GMDH генерирует новые слои, и сеть растет, в то время как число Fr

превышает заданный порог. Псевдокод описанного алгоритма GMDH описан ниже.

Обучение нейронных сетей типа GMDH

Основные этапы обучения сети типа GMDH представлены алгоритмом 1. Алгоритм определяет обучающие данные [X | y?]

и число нейронов F (или ”свобода” выбора), которые будут выбраны для новых слоев. Первый слой r=1 генерируется, а затем нейроны, которые лучше всего подходят к данным, выбираются для следующего слоя. Алгоритм останавливается, если число выбранных нейронов, Fr, становится меньше заданного порога F0

.

Процедура InitiateNet назначает сетевые параметры Rn, Ln, In, Wnи Zn. Здесь Rn-индексы нейронов r, Ln-ошибки нейронов, In-входные данные i1,i2

Wn-векторы коэффициентов нейронов, а Zn-выходы выбранных нейронов.

В GenerateFirstLayer алгоритм генерирует первый слой нейронов с входными данными xi1,xi2

Нейроны подстраиваются под данные, и параметры сети частично обновляются. ?, w^

, и y.

Процедура GenerateNewLayer определяет индексы нейронов на предыдущем слое. Затем номер Fr

а индексы А1 из выделенных нейронов определяются. Для заданных входных данных zi1,zi2

новые нейроны генерируются в соответствии с процедурой GenerateFirstLayer.

В SelectBest алгоритм генерирует нейроны на заданном слое r. Сгенерированные нейроны сортируются по ошибкам регуляризации, хранящимся в Ln в порядке возрастания. Первый Fr

для новых слоев выбираются нейроны с наименьшими ошибками. Выбор не включает нейроны с коррелированными выходами. Процедура возвращает значение false, если число выбранных нейронов находится ниже порогового значения F0

В противном случае процедура возвращает true для дальнейшего роста сети типа GMDH.

Процедура UpdateNet соответствует вектору коэффициента w^

к заданному входу U. Ошибка регуляризации ?

вычисляется для подогнанных нейронов, а затем Параметры сети Net сохраняются для следующих слоев.

Алгоритм GMDH генерирует новые слои, в то время как производительность сети увеличивается на определенное значение. В противном случае алгоритм останавливается, и выращенная сеть представляется матричным нетто.

фигураа

Экспериментальные установки

Характеристики сетей RF, ANN, SVM, а также сетей типа GMDH зависят от их параметров, которые должны быть оптимизированы “примерным” способом во время экспериментов с заданными данными44. Диагностическая эффективность оценивалась с использованием метода перекрестной валидации leave-one-out, который обычно используется при малом размере выборки45.

Важно отметить, что стандартный анализ главных компонент не может эффективно использоваться для уменьшения размерности данных, когда наборы данных малы. Это объясняется тем, что основные компоненты, рассчитанные на небольшом наборе данных, подвержены большой изменчивости46.

В наших сравнительных экспериментах максимальные характеристики RF, ANN и SVM были достигнуты при следующих настройках.

  1. 1.

    Лучший РЧ был с количеством классификационных деревьев =200

, минимальное количество образцов на терминалах =3, скорость атрибута =0.8, и частота дискретизации =0.7

  • 2.

    Лучшая Энн была с количеством скрытых нейронов ={7,12}

  • , метод обучения=Levenberg-Marquardt, скорость обучения ={0.2,0.6}, правило ранней остановки, активация =
    1. логсиг

    2. 3.

      Лучший SVM был с ядром Радиальной базисной функции и гаммой, оптимизированной на перекрестной проверке.

    Максимальная производительность ГМДГ была экспериментально найдена при следующих параметрах.

    1. 1.

      Свобода выбора F=m

  • , где m - максимальное число текстурных объектов

  • 2.

    Минимальное количество нейронов F0=2

  • 3.

    Функция активации y=?0+?1x1+?2x2+?3x1x2

  1. 4.

    Размер обучающих данных составил 31, и 8 выборок данных были использованы для внешней оценки в каждом из 40 раундов кросс-валидации leave-one-out.

Особенности Харалика были использованы с тремя текстурными параметрами, извлеченными из матриц встречаемости серого уровня11,47. В таблице 4 показаны особенности текстуры Харалика, использованные в наших экспериментах.

Таблица 4 особенности текстуры Харалика.

Полноразмерный стол

Моменты Цернике были рассчитаны для порядка 16 таким образом, чтобы сгенерировать 81 объект. В наших экспериментах реальная часть моментов была взята в качестве текстурных признаков.

Регламентные заявления

Авторы делают следующие заявления: Рентгеновские снимки коленного сустава , отобранные для наших экспериментов, были собраны в национальном исследовании37,38, проведенном в соответствии с утвержденными этическими правилами и протоколами исследования. Исследование было рассмотрено и одобрено Национальным комитетом по защите данных (Comiss?o Nacional de Prote??o de Dados) и Комитетом по этике медицинской школы NOVA. Этические комитеты региональных органов здравоохранения (АРС) также рассмотрели и одобрили это исследование.

Все методы, использованные в нашем исследовании, были выполнены в соответствии с соответствующими руководящими принципами и правилами. Эксперименты, описанные в нашей статье, были проведены на рентгеновских снимках коленного сустава участников, получивших информированное согласие в рамках вышеупомянутого национального исследования.


Источник: spb.hse.ru

Комментарии: