Нейросеть научили открывать глаза на фотографии

2018-06-20 11:38

Dolhansky & Canton Ferrer / Facebook, Inc. 2018

Разработчики Facebook модернизировали архитектуру порождающих состязательных нейросетей, добавив к ней образец — пример того, как может выглядеть конечный объект. Алгоритм, основанный на такой нейросети, может реалистично открыть закрытые на фотографии глаза, наложив на веки изображение глаза определенного человека. Статья опубликована на сайте Facebook Research.

Порождающие состязательные сети состоят их двух соревнующихся систем: генератора и дискриминатора. Генератор создает новые объекты, а дискриминатор оценивает их, сравнивая с обучающей выборкой (к ней у генератора доступа нет), после чего дает генератору ответ: на основании этого ответа генератор корректирует создаваемые им объекты. Очень часто разработчики модернизируют архитектуру такой нейросети, добавляя к ней новые компоненты. Например, порождающая состязательная сеть с дополнительным слоем внимания может создавать точные изображения на основе текстового описания; кроме того, при помощи дополнительного условия также можно «раскрашивать» карандашный набросок, превращая его в фотореалистичный портрет.

Новая архитектура, разработанная Брайаном Долгански (Brian Dolhansky) и Кристианом Кантон Феррером (Christian Canton Ferrer) из Facebook, названа образцовой порождающей состязательной сетью (англ. exemplar generative adversarial network, сокращенно exGAN) и отличается от стандартной нейросети подобного рода тем, что для успешного выполнения задачи ей нужен один образец. С помощью этого разработчики обучили нейросеть реалистично «открывать» глаза, сохраняя черты человека на фотографии.

Каждый ряд слева направо: человек с открытыми глазами, человек с закрытыми глазами, пример работы старых алгоритмов, работа нового алгоритма

Dolhansky & Canton Ferrer / Facebook, Inc. 2018

В ходе тренировки алгоритма система обучалась вставлять глаза из образца (фотографии человека с открытыми глазами) на фотографию, где глаза замазаны. Дискриминатор модели, в свою очередь, сравнивал получившийся результат с незамазанным изображением. Модель обучили на базе данных фотографий около 17 тысяч знаменитостей: для каждого из них было доступно как минимум три снимка.

Результаты полученной модели превосходят по качеству все известные алгоритмы «открывания» глаз, включая способы, представленные в Adobe Photoshop. Использование изображения-образца позволяет вставлять «правильные» глаза. Сгенерированные изображения показали нескольким добровольцам: исследователи сообщают, что в 54 процентах случаях участники либо выбирали изображение с искусственно открытыми глазами, либо не были уверены в том, какая из фотографий — настоящая.

Тем не менее, у алгоритма, по словам разработчиков, пока что есть недостатки: он не всегда правильно угадывает цвет радужки и плохо воссоздает форму, если на изображении закрытый глаз прикрыт, к примеру, волосами.

Dolhansky & Canton Ferrer / Facebook, Inc. 2018

В целом, с помощью усовершенствования такого алгоритма можно в скором времени улучшить редактирование фотографий: в частности, исправить снимки, на которых кто-то моргнул или прикрыл глаза. Разработчики также представили датасет для дальнейшего обучения таких моделей.

С помощью машинного обучения компьютерные программы учат не только добавлять объекты на изображения, но и удалять их. Этим, к примеру, уже долгое время занимаются разработчики из Adobe: в 2015 году они научили алгоритм удалять с фотографий лишние предметы, а недавно смогли сделать то же самое с видео.

Елизавета Ивтушок

Телеграм: t.me/ainewsline

Источник: nplus1.ru



		Нейросеть научили открывать глаза на фотографии
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2018-06-20 11:38 нейросети новости Dolhansky & Canton Ferrer / Facebook, Inc. 2018 Разработчики Facebook модернизировали архитектуру порождающих состязательных нейросетей, добавив к ней образец — пример того, как может выглядеть конечный объект. Алгоритм, основанный на такой нейросети, может реалистично открыть закрытые на фотографии глаза, наложив на веки изображение глаза определенного человека. Статья опубликована на сайте Facebook Research. Порождающие состязательные сети состоят их двух соревнующихся систем: генератора и дискриминатора. Генератор создает новые объекты, а дискриминатор оценивает их, сравнивая с обучающей выборкой (к ней у генератора доступа нет), после чего дает генератору ответ: на основании этого ответа генератор корректирует создаваемые им объекты. Очень часто разработчики модернизируют архитектуру такой нейросети, добавляя к ней новые компоненты. Например, порождающая состязательная сеть с дополнительным слоем внимания может создавать точные изображения на основе текстового описания; кроме того, при помощи дополнительного условия также можно «раскрашивать» карандашный набросок, превращая его в фотореалистичный портрет. Новая архитектура, разработанная Брайаном Долгански (Brian Dolhansky) и Кристианом Кантон Феррером (Christian Canton Ferrer) из Facebook, названа образцовой порождающей состязательной сетью (англ. exemplar generative adversarial network, сокращенно exGAN) и отличается от стандартной нейросети подобного рода тем, что для успешного выполнения задачи ей нужен один образец. С помощью этого разработчики обучили нейросеть реалистично «открывать» глаза, сохраняя черты человека на фотографии. Каждый ряд слева направо: человек с открытыми глазами, человек с закрытыми глазами, пример работы старых алгоритмов, работа нового алгоритма Dolhansky & Canton Ferrer / Facebook, Inc. 2018 В ходе тренировки алгоритма система обучалась вставлять глаза из образца (фотографии человека с открытыми глазами) на фотографию, где глаза замазаны. Дискриминатор модели, в свою очередь, сравнивал получившийся результат с незамазанным изображением. Модель обучили на базе данных фотографий около 17 тысяч знаменитостей: для каждого из них было доступно как минимум три снимка. Результаты полученной модели превосходят по качеству все известные алгоритмы «открывания» глаз, включая способы, представленные в Adobe Photoshop. Использование изображения-образца позволяет вставлять «правильные» глаза. Сгенерированные изображения показали нескольким добровольцам: исследователи сообщают, что в 54 процентах случаях участники либо выбирали изображение с искусственно открытыми глазами, либо не были уверены в том, какая из фотографий — настоящая. Тем не менее, у алгоритма, по словам разработчиков, пока что есть недостатки: он не всегда правильно угадывает цвет радужки и плохо воссоздает форму, если на изображении закрытый глаз прикрыт, к примеру, волосами. Dolhansky & Canton Ferrer / Facebook, Inc. 2018 В целом, с помощью усовершенствования такого алгоритма можно в скором времени улучшить редактирование фотографий: в частности, исправить снимки, на которых кто-то моргнул или прикрыл глаза. Разработчики также представили датасет для дальнейшего обучения таких моделей. С помощью машинного обучения компьютерные программы учат не только добавлять объекты на изображения, но и удалять их. Этим, к примеру, уже долгое время занимаются разработчики из Adobe: в 2015 году они научили алгоритм удалять с фотографий лишние предметы, а недавно смогли сделать то же самое с видео. Елизавета Ивтушок Телеграм: t.me/ainewsline Источник: nplus1.ru Комментарии:

Нейросеть научили открывать глаза на фотографии

Комментарии: