Машинное обучение и биоинформатика, часть 4. Анализ изображений в биологии. Распознаем котиков и рак

2017-04-06 10:50

распознавание образов, новости нейронных сетей, реализация нейронной сети

Исторически, возможно, наиболее важные успехи глубинных нейронных сетей были в анализе изображений. Архитектуры глубинных нейросетей, подготовленные на миллионах фотографий, могут обнаруживать объекты на картинках гораздо лучше, чем люди. Все современные модели в классификации изображений, обнаружении объектов, поиске изображений и семантической сегментации используют нейронные сети. Сверточная нейронная сеть является наиболее распространенной сетевой архитектурой для анализа изображений. Вкратце, CNN выполняет операции сопоставления с образцом (свертки) и агрегирования (объединения).

Подробнее о сверточных нейросетях

Сверточные нейронные сети (CNN) были первоначально вдохновлены когнитивной нейронаукой, а семантическая работа Хьюбела и Визеля по зрительной коре кошки, в которой было обнаружено наличие простых нейронов, реагирующих на небольшие мотивы в поле зрения, и сложные нейроны, реагирующие на более крупные ( Hubel & Wiesel, 1963, 1970).

CNN предназначены для моделирования входных данных в виде многомерных массивов, таких как двумерные изображения с тремя цветовыми каналами (LeCun et al., 1989; Jarrett et al., 2009; Krizhevsky et al., 2012; Zeiler & Fergus, 2014; Szegedy et al., 2015a) или одномерные геномные последовательности с одним каналом на нуклеотид ( Alipanahi et al., 2015; Wang et al., 2015; Zhou & Troyanskaya, 2015; Angermueller et al., 2016; Kelley et al., 2016).

Высокая размерность этих данных (до миллионов пикселей для изображений с высоким разрешением) делает обучение полностью связанной нейронной сети сложной задачей, так как число параметров такой модели обычно превышает нужное количество имеющихся данных обучающей выборки. Чтобы решить эту проблему, CNNs делают дополнительные предположения относительно структуры сети, таким образом уменьшая эффективное количество параметров, для обучения. Сверточный слой состоит из нескольких отображений нейронов, так называемых карт признаков или фильтров, размер которых равен разрешению входящего изображения. Гиперпараметры модели, такие как количество сверточных уровней, количество функциональных карт или размер рецептивных полей, зависят от приложения и должны быть строго выбраны в наборе данных для проверки.

Существуют две концепции, которые позволяют уменьшить количество параметров модели: локальная связность и разделение параметров.

Во-первых, в отличие от полностью подключенной сети, каждый нейрон внутри карты признаков соединен только с локальным участком нейронов предыдущего слоя, так называемым восприимчивым полем.

Во-вторых, все нейроны в пределах данной карты признаков имеют одинаковые параметры. Следовательно, все нейроны в пределах карты признаков просматривают одну и ту же функцию на предыдущем уровне, однако в разных местах. Различные карты признаков могут, например, обнаруживать ребра различной ориентации в изображении или мотивы последовательности в геномной последовательности. Активность нейрона получается путем вычисления дискретной свертки его рецептивного поля, то есть вычисления взвешенной суммы входных нейронов и применения функции активации.

На уровне пикселей операция свертки сканирует изображение с заданным образцом и вычисляет силу совпадения для каждой позиции. Объединение определяет наличие шаблона в регионе, например, путем вычисления максимального соответствия шаблону в меньших участках (максимальное объединение), тем самым агрегируя информацию о регионе в одно число. Последовательное применение операций свертки и объединения является основой большинства сетевых архитектур, используемых при анализе изображений.

В большинстве приложений точное положение и частота признаков не важны для окончательного прогноза, например, распознавание объектов в изображении. Используя это предположение, объединяющий слой суммирует соседние нейроны, вычисляя, например, максимальный или средний по их активности, что приводит к более плавному представлению активности признака.

Путем применения той же операции объединения к небольшим фрагментам изображения, которые сдвинуты более чем на один пиксель, входное изображение эффективно сбрасывается, тем самым дополнительно уменьшая количество параметров модели. CNN обычно состоит из нескольких сверточных и объединенных слоев, что позволяет изучать все более абстрактные функции при увеличении масштаба от малых ребер, до частей объектов и, наконец, до целых объектов. Один или несколько полностью соединенных слоев могут следовать за последним слоем объединения.

Первые приложения в вычислительной биологии - классификация на уровне пикселей

Ранние применения глубоких сетей для биологических изображений работали на задачах уровня пикселей, а дополнительные модели строились на выходах нейросетей. Например, Ning et al (2005) применили сверточные нейронные сети в исследовании, которое предсказало аномальное развитие у эмбрионов C. elegans.

Они обучили CNN на 40 ? 40 пиксельных кусочках изображения, чтобы классифицировать центральный пиксель на клеточную стенку, цитоплазму, мембрану ядра, ядро или внешнюю среду, используя три сверточных и объединенных слоя, а затем полностью связанный выходной слой. Затем прогнозы модели были переданы в энергетическую модель для дальнейшего анализа.

CNN превосходят стандартные методы, например марковские случайные поля (Markov random fields) и условные случайные поля (conditional random fileds) (Li, 2009). Добавление слоев позволяет перейти от очистки шума пикселя к моделированию более абстрактных функций изображения. Ciresan et al (2013) использовали пять сверточных и объединенных слоев, а затем два полностью связанных слоя, чтобы найти митоз в изображениях гистологии груди. Эта модель выиграла чемпионат обнаружения митоза на международной конференции распознавания образов 2012 года, значительно опередив конкурентов. Тот же подход был также использован для сегментации нейронных структур в изображениях электронной микроскопии, классифицируя каждый пиксель как мембранный или не мембранный (Ciresan et al, 2012). В этих приложениях, в то время как CNN обучались сквозным образом и была необходима дополнительная последующая обработка для получения вероятностей классов из результатов для новых изображений. Последовательные операции объединения теряют информацию о локализации, так как из больших и больших регионов сохраняются только их свертки. Чтобы избежать этого, можно добавить в нейронную сеть ссылки на пропуск, которые будут переносить информацию с ранних, "мелкозернистых" слоев вперед на более глубокие. В настоящее время наиболее эффективный метод классификации на уровне пикселей для нейронных структур (Ronneberger et al, 2015) использует архитектуру, в которой нейроны берут входные данные от нижних уровней для локализации функций с высоким разрешением, а также для преодоления произвольного выбора размера фона.

Анализ целых клеток, клеточных популяций и тканей

Во многих случаях предсказания на уровне пикселей не требуются. Например, Xu и др. напрямую классифицировали изображения гистопатологии кишки в раковые и нераковые, обнаружив, что контролируемое обучение признакам с использование глубинных сетей работало лучше, чем использование признаков выбраных вручную (Xu et al, 2014). P?rnamaa и Parts использовали CNN для классификации предварительно обработанных участков изображений отдельных дрожжевых клеток, несущих флуоресцентный белок в различных субклеточных структурах (P?rnamaa & Parts, 2016). И снова, глубинные сети превзошли методы, основанные на традиционных признаках. Кроме того, Краус и др. объединили задачи сегментации и классификации в единую архитектуру, которая может быть обучена из конца в конец и применили модель к изображениям микроскопии дрожжей высокого разрешения (Kraus et al, 2015). Такой подход позволил классифицировать целые изображения без сегментации, которую использовали в качестве шага предварительной обработки. CNN даже применялись для подсчета бактериальных колоний в агаровых чашках (Ferrari et al, 2015). Начиная с ранних приложений для устранения шума на уровне пикселей область исследований двигалась в направлении сквозных пайплайнов анализа изображений, которые используют большие наборы данных биологических изображений и репрезентативную мощность CNN.

Повторное использование обученных моделей

Обучение сверточных нейронных сетей требует больших наборов данных. Хотя сбор биологических данных может быть дорогостоящим, это не означает, что глубокие нейронные сети не могут использоваться, когда миллионы изображений недоступны. Независимо от источника изображения, более низкие уровни сети имеют тенденцию захватывать схожие сигналы (края, скругления и т.д.), которые не являются специфичными для обучающих выборок, но повторяются в задачах распознавания в целом.

Таким образом, сверточные нейронные сети могут повторно использовать изображения из аналогичного набора данных для помощи в обучении или даже быть обученными на других данных, тем самым требуя меньшее количество изображений для точной настройки модели для интересующей задачи. Действительно, Donahue et al (2013) и Razavian et al (2014) показали, что функции, полученные из миллионов изображений для классификации объектов, могут успешно использоваться при поиске, обнаружении или классификации изображений в новых наборах данных, где помечены только сотни изображений (а не сотни тысяч или миллионы, например). Эффективность такого подхода зависит от сходства между обучающей выборкой и новым набором данных.

Концепция передачи параметров модели также оказалась успешной в анализе биоизображений. Например, Zhang et al (2015) показали, что функции, полученные из естественных изображений, могут быть трансформированы в биологические данные, улучшая предсказание стадий развития Drosophila melanogaster от изображений гибридизации in situ. Модель была предварительно подготовлена на основе данных из ImageNet - открытого корпуса из более чем миллиона разнообразных изображений, для извлечения качественных признаков в разных масштабах, далее использовали синтетические изображения для подготовки CNN для автоматического подсчета клеток изображениях микроскопий.

Слои свертки и объединения объединяются в стек, тем самым создавая глубокую сеть для анализа изображений. В стандартных приложениях уровни свертки сопровождаются уровнем объединения. В этом примере сверточные блоки низшего уровня работают кусочками 3 ? 3 квадрата, но более глубокие используют и захватывают информацию из более крупных регионов. За такими сверточными шаблон - соотносящими слоями следуют один или несколько полностью связанных слоев, чтобы узнать, какие признаки наиболее информативны для классификации. Для каждого слоя с обучаемыми весами показаны три примера изображений, которые максимизируют некоторый выход нейрона:

Ожидается, что сетевые репозитории, в которых размещаются предварительно натренированные модели, появятся для анализа биологических изображений. Эти обученные модели могут быть загружены и использованы как экстракторы признаков или дополнительно доработаны и адаптированы к конкретной задаче для мелкомасштабных данных.

Источник: compbiol.ru

Машинное обучение и биоинформатика, часть 4. Анализ изображений в биологии. Распознаем котиков и рак

Комментарии: