ColTran: нейросеть раскрашивает черно-белые изображения |
||
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2021-02-04 20:06 Colorization Transformer — это нейросетевая модель, которая окрашивает черно-белые изображения и основывается на механизме внимания. Модель принимает на вход черно-белое изображение. Процесс окрашивания проходит в три этапа. Сначала авторегрессионная Transformer-модель производить окраску в низком разрешении. Архитектура модели использует условные Transformer слои для эффективной обработки изображений. Затем две параллельные нейросети улучшают разрешение и окраску изображения. По результатам экспериментов, модель обходит state-of-the-art архитектуры для раскраски изображений. В качестве метрики использовали FID и результаты опроса на платформе Mechanical Turk. В более чем 60% участники опроса предпочитали результат модели реальному изображению. Зачем это нужно Окраска изображения — это комплексная задача, которая требует от модели понимания семантики сцены и базовых знаний об окружающем мире.Одними из применений таких моделей являются цветовая коррекция существующих цветных изображений и восстановление цвета у черно-белых изображений и видеозаписей. Детали архитектуры Исследователи утверждают, что Colorization Transformer — это первый случай использования Transformer-модели для задачи окраски изображения в высоком разрешении (256 ? 256). Они предлагают условные Transformer-слои для колоризации изображения в низком разрешении, а затем последовательное улучшение разрешения. Подход состоит из трех отдельных моделей, каждая из которых обучается независимо от остальных:
Модели апсемплинга в ColTran являются слоями механизма внимания, которые параллельно апсемплят цвет и разрешение изображения. Каждый блок внимания состоит из следующих операций: нормализация слоев ? механизм внимания ? многослойный перцептрон. Источник: neurohive.io Комментарии: |
|