MichiGAN: нейросеть редактирует прическу на изображении

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


MichiGAN — это генеративно-состязательная нейросеть, которая редактирует прическу на изображении. На основе портретного снимка модель позволяет модифицировать прическу персоны по нескольким референсным снимкам. Модель дает возможность редактировать отдельное такие атрибуты прически, как внешний вид, структура и форма. При этом задний фон изображения остается целым. Кроме того, модель может модифицировать несколько атрибутов прически совместно. По результатам экспериментов, MichiGAN обходит альтернативные подходы по степени интерактивности редактирования и по качеству итоговых снимков.

Интерактивная система редактирования прически

Подробнее про модель

MichiGAN состоит из базовой генеративной сети и трех условных модулей (condition modules): для формы и структуры, внешнего вида и заднего фона. Генератор — это последовательная конкатенация шести апсемплинг остаточных блоков SPADE (ResBlk) и сверточный слой, который выдает итоговое изображение. 

Визуализация составных частей подхода

Подробнее условные модули и базовая архитектура описаны в оригинальной статье.

Оценка работы модели

Исследователи сравнивали работу MichiGAN с альтернативными архитектурами. Ниже видно, что модель работает сравнимо или лучше state-of-the-art моделей, в зависимости от разрешения изображений.

Количественное сравнение конкурирующих подходов на датасете Flickr-Faces-HQ

Источник: neurohive.io

Комментарии: