Генерим аниме-тян с помощью машинного обучения: обзор забавного проекта

2018-12-04 17:45

машинное обучение python, капсульные сети

Машинное обучение можно использовать для создания автопилотов, точных прогнозов погоды и многого другого. А можно заняться чем-то действительно полезным вроде рисования аниме-тян. Представляем вам рассказ автора проекта, в котором используется глубокое обучение для создания лиц аниме-девушек.

Нам нравится создавать разные прикольные штуки, связанные с ИИ. В этот раз наш взор пал на генеративно-состязательную сеть (Generative Adversarial Networks, GAN), которая бы создавала новые аниме-лица после обучения на наборе лиц, нарисованных людьми. Мы начали с онлайн-примера, код и набор с аниме-лицами которого можно найти здесь.

Как вы видите, GAN со временем совершенствуется в создании реалистичных изображений. GAN содержит генератор, создающий новые изображения, и дискриминатор, который даёт ему конструктивный фидбек. Генератор и дискриминатор являются свёрточными нейронными сетями (Convolutional Neural Networks, CNN).

Пример тренировочных данных:

А вот неплохой пример конечного результата:

На этом изображении видно, что у персонажа в правом нижнем углу есть бант на голове, а глаза и рот находятся там, где и должны. Некоторые лица выглядят искажёнными, как, например, второе лицо слева в первом ряду. В целом, изображения выглядят неплохо, хотя они не очень большие (64х64 пикселей на три цветовых канала).

Результат вышел отличным, но у свёрточных нейронных сетей есть определённые ограничения. Например, капсульные сети лучше понимают, как предметы должны располагаться:

Свёрточные сети считают лицом то, что видят, если есть все необходимые компоненты (глаза, нос, рот и т. п.), пускай даже не в тех местах. Капсульные сети призваны решить эту проблему.

Будучи трудолюбивым человеком, Мэри Кейт Макферсон попробовала решить эту задачу, использовав в качестве дискриминатора GAN с капсульной сетью вместо CNN. Набор данных переместили из исходной кодовой базы в кодовую базу капсульной сети. Код капсульной сети взяли отсюда, а исходный генератор заменили на генератор для данного проекта, чтобы он создавал аниме-девушек, а не рукописные цифры.

Обучение новой архитектуры с капсульной сетью:

Итоговый выход капсульной GAN. Некоторые лица получились хорошо. Другие вроде второго слева на первом и последних рядах, не содержали нужных частей лица:

Мы не заметили особых улучшений при использовании капсульной сети вместо свёрточной в качестве дискриминатора. Возможно, генерация и распознавание статистических признаков дали бы лучший результат (идея взята из работы nVidia). Мы работаем над этим. Мы добавили слой в генератор предсказаний, который создаёт гистограмму направленных градиентов (Histogram of Oriented Gradients, HOG) сгенерированной картинки. HOG используют при распознавании объектов, поэтому мы подумали, что это может помочь нейронной сети научиться создавать лица получше.

Также мы подумываем об очистке набора данных. Мэри Кейт Макферсон сообщит о результатах этого приключения в твиттере нашего проекта, когда у нас появятся положительные результаты. Если у вас есть собственный генератор, мы с радостью запостим и ваши результаты. Пока что новый подход выглядит не очень многообещающим, однако именно так и работают сторонние проекты: ничего не работает до тех пор, пока вдруг не заработает.

Ещё одна идея на будущее: GAN’ы с множеством капсульных сетей!

Итак, это был очередной пример того, как можно использовать искусственный интеллект для создания новых изображений в определённом стиле.

Телеграм: t.me/ainewsline

Источник: tproger.ru



		Генерим аниме-тян с помощью машинного обучения: обзор забавного проекта
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Разработка ИИ Атаки на ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Нейроинтерфейс Психология Работа мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовый компьютер Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2018-12-04 17:45 машинное обучение python, капсульные сети Машинное обучение можно использовать для создания автопилотов, точных прогнозов погоды и многого другого. А можно заняться чем-то действительно полезным вроде рисования аниме-тян. Представляем вам рассказ автора проекта, в котором используется глубокое обучение для создания лиц аниме-девушек. Нам нравится создавать разные прикольные штуки, связанные с ИИ. В этот раз наш взор пал на генеративно-состязательную сеть (Generative Adversarial Networks, GAN), которая бы создавала новые аниме-лица после обучения на наборе лиц, нарисованных людьми. Мы начали с онлайн-примера, код и набор с аниме-лицами которого можно найти здесь. Как вы видите, GAN со временем совершенствуется в создании реалистичных изображений. GAN содержит генератор, создающий новые изображения, и дискриминатор, который даёт ему конструктивный фидбек. Генератор и дискриминатор являются свёрточными нейронными сетями (Convolutional Neural Networks, CNN). Пример тренировочных данных: А вот неплохой пример конечного результата: На этом изображении видно, что у персонажа в правом нижнем углу есть бант на голове, а глаза и рот находятся там, где и должны. Некоторые лица выглядят искажёнными, как, например, второе лицо слева в первом ряду. В целом, изображения выглядят неплохо, хотя они не очень большие (64х64 пикселей на три цветовых канала). Результат вышел отличным, но у свёрточных нейронных сетей есть определённые ограничения. Например, капсульные сети лучше понимают, как предметы должны располагаться: Свёрточные сети считают лицом то, что видят, если есть все необходимые компоненты (глаза, нос, рот и т. п.), пускай даже не в тех местах. Капсульные сети призваны решить эту проблему. Будучи трудолюбивым человеком, Мэри Кейт Макферсон попробовала решить эту задачу, использовав в качестве дискриминатора GAN с капсульной сетью вместо CNN. Набор данных переместили из исходной кодовой базы в кодовую базу капсульной сети. Код капсульной сети взяли отсюда, а исходный генератор заменили на генератор для данного проекта, чтобы он создавал аниме-девушек, а не рукописные цифры. Обучение новой архитектуры с капсульной сетью: Итоговый выход капсульной GAN. Некоторые лица получились хорошо. Другие вроде второго слева на первом и последних рядах, не содержали нужных частей лица: Мы не заметили особых улучшений при использовании капсульной сети вместо свёрточной в качестве дискриминатора. Возможно, генерация и распознавание статистических признаков дали бы лучший результат (идея взята из работы nVidia). Мы работаем над этим. Мы добавили слой в генератор предсказаний, который создаёт гистограмму направленных градиентов (Histogram of Oriented Gradients, HOG) сгенерированной картинки. HOG используют при распознавании объектов, поэтому мы подумали, что это может помочь нейронной сети научиться создавать лица получше. Также мы подумываем об очистке набора данных. Мэри Кейт Макферсон сообщит о результатах этого приключения в твиттере нашего проекта, когда у нас появятся положительные результаты. Если у вас есть собственный генератор, мы с радостью запостим и ваши результаты. Пока что новый подход выглядит не очень многообещающим, однако именно так и работают сторонние проекты: ничего не работает до тех пор, пока вдруг не заработает. Ещё одна идея на будущее: GAN’ы с множеством капсульных сетей! Итак, это был очередной пример того, как можно использовать искусственный интеллект для создания новых изображений в определённом стиле. Телеграм: t.me/ainewsline Источник: tproger.ru Комментарии:

Генерим аниме-тян с помощью машинного обучения: обзор забавного проекта

Комментарии: