State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-02-24 17:13 Нейросеть обучили семантически сегментировать объекты на изображении, имея только лейблы классов объектов без попиксельной разметки. Модель итеративно выучивает схожесть пикселей и выдает более правдоподобные маски объектов. Предложенный подход обходит предыдущие модели, которые обучаются в weakly-supervised манере. При семантической сегментации на ограниченном количестве размеченных данных модель не получает попиксельно размеченную информацию об объектах на изображении. Предыдущие подходы использовали сети классификации, чтобы локализовать объекты через выбор зон на изображении с высокой вероятностью. Архитектура модели Исследователи решают задачу семантической сегментации на ограниченном сете размеченных данных (weakly-supervised semantic segmentation) с помощью итеративного алгоритма оптимизации. Алгоритм прогрессивно выучивает устойчивые сходства между пикселям и распространяет информацию о лейблах между пикселями. Целевая функция алгоритма максимизирует вероятность верных классов объектов на изображении. Это отличается от сегментации с учителем, которая требует разметку верных классов. Предложенный подход основан на EM-алгоритме, который выучивает параметры двух подсетей:
Матрица сходства пикселей (affinity matrix) хранит в себе близость между пикселями и широко используется в задаче сегментации объектов. Выученные сходства применяются для сегментации объектов входного изображения. Маски сегментации затем используются для дообучения унарной сети. Процедуры повторяются итеративно, чтобы модель выучивала более достоверные сходства пикселей и выдавала более точные границы объектов. Тестирование работы нейросети Алгоритм оценивали на датасетах PASCAL VOC 2012 и COCO. На PASCAL VOC 2012 предложенную модель сравнивали с state-of-the-art weakly-supervised подходами для семантической сегментации. Ниже видно, что предложенный алгоритм более точно сегментирует объекты на изображениях в сравнении с предыдущими моделями. Источник: neurohive.io Комментарии: |
|