Нейросеть от FAIR генерирует 3D фотографию из 2D |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-03-15 10:00 В Facebook появилась возможность конвертировать свою 2D фотографию в 3D с помощью функционала 3D Photos. Внутри 3D Photos — сверточная нейросеть, которая принимает на вход 2D фото и генерирует карту глубины этого фото. Функционал 3D Photos от Facebook запустили в 2018. 3D Photos требовал наличие в смартфоне режима “портретного снимка” c двойной камерой. Такой характеристикой обладают исключительно смартфоне последних поколений. Из-за этого функионалом не могли пользоваться владельцы телефонов без фронтальной камеры. В обновленном 3D Photos функция доступна для владельцев любых смартфонов. Модель восстанавливает 3D структуру любого изображения: от недавно сделанного до изображения десятилетней давности. Архитектура модели основана на CNN. Сверточная нейросеть принимает на вход RGB изображение. На выходе модель для каждого пикселя предсказывает его расстояние до камеры. Сеть состоит из набора параметризованных блоков. Размеры блоков подбирали с помощью автоматического поиска. Веса обученной нейросети квантизировали, чтобы обеспечить высокую производительность модели в продакшене. Блоки в нейросети Модель в 3D Photos использует архитектуру блоков, которая вдохновлена FBNet. FBNet — это фреймворк для оптимизации структуры сверточной сети под мобильные или другие девайсы с ограниченными ресурсами. Блок состоит из point-wise свертки, опционального апсемплинга, K x K свертки и дополнительной point-wise свертки. Сама архитектура нейросети напоминает U-net. Кодировщик и декодировщик нейросети состоят из 5 шагов. Источник: neurohive.io Комментарии: |
|