DeepView: нейросеть восстанавливает 3D вид по паре фотографий |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-06-27 15:56 DeepView — это нейросеть, которая по паре входных фотографий восстанавливает вид с фотографии с остальных ракурсов. Результаты работы нейросети можно посмотреть на официальном сайте. Модель получает state-of-the-art результаты на датасетах Lytro и Spaces, который был собран исследователями вручную. Нейросеть принимает на вход изображения одного вида с разных ракурсов и восстанавливает остальные ракурсы так, что на изображение можно смотреть в 3D. Модель учитывает такие характеристики вида, как границы объектов, тени от освещения, тонкие объекты и сцены с сложной перспективой. Что внутри DeepView Пайплайн работы модели состоит из следующих шагов:
Изображения обрабатываются в сверточной нейросети, которая предсказывает многоплановое изображение. Предсказанное изображение затем итеративно улучшается. Для этой задачи градиенты имеют интуитивное объяснение. Они кодируют характеристики сцены между входными видами слоями многопланового изображения. Изображения, которые нейросеть отдает на выходе, могут использоваться для синтезирования изображений видов в реальном времени. DeepView состоит из нескольких частей:
Оценка работы модели Исследователи провели два эксперимента: на готовом датасете от Kalantari et al. (Lytro) и на собственном датасете Spaces, который также был опубликован. Lytro часто используется для генерации сцен, но изображения там ограничены маленьким диаметром линзы. Задача синтезирования видов на основе изображений с разных ракурсов более комплексная. Spaces исследователи собрали именно поэтому. Ниже видно, что результаты DeepView сравнимы с state-of-the-art методом Soft3D. Источник: neurohive.io Комментарии: |
|