Возможности и препятствия для глубокого обучения в области биологии и медицины

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Необработанные входные данные, наблюдаемые в большом количестве в биологии и медицине, представляются сложными и часто плохо понятными. Для обработки таких данных в слоях промежуточных объектов используют класс алгоритмов машинного обучения, называемый глубоким обучением. (Нейронная сеть состоит из слоев, связывающих нейроны так, что данные в такой сети идут строго в одном направлении — от входов первого слоя к выходам последнего.) [2]

Задачи такого обучения сводятся к правильной классификации пациентов, фундаментальным биологическим процессам и лечению пациентов.

Проблемы, препятствующие решению таких задач, заключаются на данный момент в интерпретации пользователей моделей нейронных сетей с целью проверки гипотезы об исследуемой системе.

Помимо прочего, существует ограниченный объем маркированных данных для обучения.

Однако имеется предвидение того, что глубокое обучение позволит внести изменения как на рабочем месте, так и у постели больного.

Введение в глубокое обучение

Путем многократного сравнения данных по критерию анализа последних выяснено, что геномика в течение следующего десятилетия будет превосходить другие области, интенсивно использующие большой набор данных.

Автоматизированные алгоритмы смогут разработать методы лечения с дальнейшей классификацией пациентов в критически важных для конфиденциальности условиях.

Достижения глубокого обучения можно свести к таким сферам как:

1) Физика высоких энергий;

2) Вычислительная химия;

3) Дерматология;

4) Письменные переводы;

Примером для последующих подходов к глубокому обучению послужила обработка информации в биологическом мозге.

Нейронные сети, используемые для глубокого обучения, имеют несколько скрытых слоев. По этой причине эти алгоритмы могут автоматически создавать функции, подходящие для многих задач.

Такой метод заменяет регрессионный подход и является формой кластеризации для более эффективного обобщения, объяснения или идентификации интересных паттернов в наборе данных.

Если используется двоичный набор данных, то простая нейронная сеть эквивалентна логистической регрессии. Тогда выходной слой должен быть монотонно-возрастающей функцией входного слоя.

Так, для непрерывных результатов линейную регрессию можно рассматривать как однослойную нейронную сеть.

«Регрессия — та же классификация, только вместо категории мы предсказываем число. Стоимость автомобиля по его пробегу, количество пробок по времени суток, объем спроса на товар от роста компании и.т.д. На регрессию идеально ложатся любые задачи, где есть зависимость от времени».[2]

Таким образом в некотором смысле контролируемые подходы глубокого обучения можно рассматривать как расширение регрессионных моделей.

В известном и раннем примере ученые из Google продемонстрировали как нейронная сеть обнаружила, что кошки, лица и пешеходы являются важными компонентами онлайн видео.

Примеры различных форм нейронных сетей.

Классификация заболеваний и пациентов

Ключевой задачей биомедицины является точная классификация заболеваний и их подтипов. В онкологии современные подходы «золотого стандарта» включают гистологию, которая требует интерпретацию экспертами или оценку молекулярных маркеров, таких как рецепторы клеточной поверхности или экспрессия генов.

Одним из примеров является подход PAM50 к классификации рака молочной железы, где экспрессия 50 маркерных генов делит больных раком молочной железы на четыре подтипа. Существенная гетерогенность все еще сохраняется внутри этих четырех подтипов.

В нескольких исследованиях использовались методы глубокого обучения для лучшей классификации больных раком молочной железы, например, шумоподавляющие автоэнкодеры (см. рисунок) могут быть использованы для кластеризации больных раком молочной железы. CNN может помочь подсчитать митотические деления. В последствии такие данные сильно коррелируют с исходом заболевания на гистологических изображениях.

Несмотря на эти недавние достижения, в этой области исследований существует ряд проблем: в первую очередь интеграция молекулярных данных и данных визуализации с другими разрозненными типами данных, таких как электронные медицинские карты.

Электронные медицинские карты

Были проанализированы простые функции с помощью глубоких нейронных сетей и обнаружены паттерны, распознаваемые алгоритмами для повторного использования в разных задачах. Цель состояла в том, чтобы проанализировать свободные текстовые части отчетов о патологии для определения первичной локализации и латеральности опухолей.

Единственные функции, которые авторы предоставили алгоритмам, были униграммы (количество одиночных слов) и биграммы (количество двухсловных комбинаций в свободном текстовом документе). Они подмножают полный набор слов и словосочетаний на 400 наиболее распространенных. Алгоритмы машинного обучения, которые они использовали (наивный Байес, логистическая регрессия и глубокие нейронные сети) выполняли задачу идентификации.

В контексте обнаружения местоположения опухоли глубокая нейронная сеть превосходила другие методы.

Фундаментальное биологическое исследование

Глубокое обучение можно применять для ответа на более фундаментальные биологические вопросы; это особенно подходит
к использованию больших объемов данных из высокопроизводительных «омических» исследований. Одна классическая биологическая
проблема, в которой машинное обучение, а теперь и глубокое обучение широко применяется, носит молекулярный характер.
Прогноз цели: например, глубокие рекуррентные нейронные сети (RNN) использовались для прогнозирования
гены-мишени микроРНК, а CNN применялись для прогноза белковых остатков.
Другие недавние захватывающие приложения глубокого обучения
включают распознавание функциональных геномных элементов.

Текстовые приложения в здравоохранении

Приложения задачи и модели глубокого обучения основанные на перспективах НЛП.

В целом, это только конец нового начала, продолжение которого следует…


Источник: m.vk.com

Комментарии: