JigsawGAN: генеративная нейросетевая модель собирает пазлы |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-02-11 20:32 JigsawGAN — это генеративная self-supervised нейросетевая модель, которую обучили на задаче сбора пазлов. Модель принимает на вход хаотично расположенные части изображения. На основе этого модель восстанавливает оригинальное изображение. Нейросеть не требует дополнительной информации по изображению для поиска решения. Нейросеть обходит альтернативные подходы по количественным и качественным метрикам. Предыдущие подходы для решения пазлов Задача сбора пазла предполагает, что изображение разрезали на равные части квадратной формы. Модель должна восстановить изображение на основе информации из частей. Стандартные алгоритмы для решения пазлов используют информацию о границах частей для поиска решения. При этом такие решения игнорируют семантическую информацию, которая хранится в частях изображения. JigsawGAN решает это ограничение и использует семантическую информацию при поиске решения. Подробнее про архитектуру JigsawGAN Исследователи разработали мультизадачный пайплайн, который включает в себя два этапа:
Модель классификации ограничена искусственно сгенерированными лейблами, которые соответствуют перемешанным частям пазла. GAN извлекает из частей изображения семантические признаки. Визуализация составных частей моделиПримеры результатов моделиИсточник: neurohive.io Комментарии: |
|