State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

МЕНЮ

Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ

Новости ИИ

Искусственный интеллект
Голосовой помощник
Городские сумасшедшие
ИИ в медицине
ИИ проекты
Искусственные нейросети
Слежка за людьми
Угроза ИИ

Разработка ИИ

ИИ теория
Компьютерные науки
Машинное обуч. (Ошибки)
Машинное обучение
Машинный перевод
Нейронные сети начинающим
Реализация ИИ
Реализация нейросетей
Создание беспилотных авто
Трезво про ИИ
Философия ИИ

Внедрение ИИ

Big data
Генетические алгоритмы
Капсульные нейросети
Основы нейронных сетей
Распознавание лиц
Распознавание образов
Распознавание речи
Техническое зрение
Чат-боты

Работа разума и сознание

Изучение сна
Изучение сознания
Нейроинтерфейс
Психология
Работа мозга
Работа памяти
Работа разума

Модель мозга

Модель мозга

Робототехника, БПЛА

Беспилотные автомобили
БПЛА
Робототехника

Трансгуманизм

Трансгуманизм

Обработка текста

Анализ социальных сетей
Компьютерная лингвистика
Лингвистика
Поисковые алгоритмы

Теория эволюции

Головной мозг
Нейронные сети
Поведение животных
Теория эволюции

Дополненная реальность

Виртулаьная реальность
Дополненная реальность

Железо

Интернет вещей
Квантовые компьютеры
Нейронные процессоры
облачные вычисления
Суперкомпьютеры

Киберугрозы

Кибербезопасность

Научный мир

Методы исследования
Наука и образование
Семинары

ИТ индустрия

ИТ-гиганты
Новости ит

Разработка ПО

Разработка ПО
Теория алгоритмов

Теория информации

Кластеризация

Математика

Актуальная математика
Статистика
Теория вероятности
Теория информации
Теория хаоса

Цифровая экономика

Технология блокчейн
Цифровая экономика

Авторизация

RSS

RSS новости

2020-02-24 17:13

теория распознавания образов

Нейросеть обучили семантически сегментировать объекты на изображении, имея только лейблы классов объектов без попиксельной разметки. Модель итеративно выучивает схожесть пикселей и выдает более правдоподобные маски объектов. Предложенный подход обходит предыдущие модели, которые обучаются в weakly-supervised манере.

При семантической сегментации на ограниченном количестве размеченных данных модель не получает попиксельно размеченную информацию об объектах на изображении. Предыдущие подходы использовали сети классификации, чтобы локализовать объекты через выбор зон на изображении с высокой вероятностью.

Архитектура модели

Исследователи решают задачу семантической сегментации на ограниченном сете размеченных данных (weakly-supervised semantic segmentation) с помощью итеративного алгоритма оптимизации. Алгоритм прогрессивно выучивает устойчивые сходства между пикселям и распространяет информацию о лейблах между пикселями. Целевая функция алгоритма максимизирует вероятность верных классов объектов на изображении. Это отличается от сегментации с учителем, которая требует разметку верных классов.

Предложенный подход основан на EM-алгоритме, который выучивает параметры двух подсетей:

Нейросети для унарной сегментации, которая предсказывает карту вероятностей входного изображения;
Сети для поиска сходства пикселей, которая выучивает матрицу сходства пикселей

Матрица сходства пикселей (affinity matrix) хранит в себе близость между пикселями и широко используется в задаче сегментации объектов. Выученные сходства применяются для сегментации объектов входного изображения. Маски сегментации затем используются для дообучения унарной сети. Процедуры повторяются итеративно, чтобы модель выучивала более достоверные сходства пикселей и выдавала более точные границы объектов.

Тестирование работы нейросети

Алгоритм оценивали на датасетах PASCAL VOC 2012 и COCO. На PASCAL VOC 2012 предложенную модель сравнивали с state-of-the-art weakly-supervised подходами для семантической сегментации. Ниже видно, что предложенный алгоритм более точно сегментирует объекты на изображениях в сравнении с предыдущими моделями.

Сравнение итоговых сегментаций на отдельных примерах

Источник: neurohive.io

State-of-the-art нейросеть для семантической сегментации с частичным привлечением учителя

Комментарии: