Алгоритм научили создавать реалистичные 3D-фотографии |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-04-16 09:32 Американские разработчики создали алгоритм для превращения обычных фотографий в трехмерные, причем с реалистично дорисованными фрагментами за объектами на снимке. Алгоритм качественно определяет границы объектов, находящихся на разном расстоянии от камеры, разделяет фрагменты изображения по глубине и дорисовывает пустые области на дальних фрагментах с помощью нейросети. Статья будет представлена на конференции CVPR, а код и примеры работы алгоритма доступны на странице авторов. Трехмерные изображения и видео дают гораздо большее чувство погружения и реалистичности, чем двумерные, но для их создания необходимо либо использовать компьютерную графику, либо, если речь о съемке реального мира, применять сложные системы из камер и алгоритмов, которые фактически недоступны обычным пользователям. В последние годы алгоритмы для работы с изображениями значительно развились и, например, в Facebook применяется функция, позволяющая превратить обычную фотографию в псевдотрехмерную. Она отделяет основной объект от остальной фотографии и как бы выносит его на передний план. Подобным образом работают и другие алгоритмы, но у этого метода есть фундаментальное ограничение — из двумерного изображения невозможно достоверно получить фрагменты, которые в момент съемки были закрыты другими объектами. Обычно это решается тем, что недостающие части просто заливают похожими цветами, но результат получается размытым и лишь отдаленно непохожим на остальную фотографию. Кроме того, достаточно сложно качественно разделить объекты по дальности от камеры. Разработчики из Политехнического университета Виргинии и Facebook под руководством Цзя Биня Хуана (Jia-Bin Huang) создали алгоритм, который позволяет добиться более качественного закрашивания фона за основными объектами в кадре. На первом этапе алгоритм разделяет плоское изображение на отдельные слои с существенно различающейся глубиной. Обычно в картах глубины со смартфонов переходы даже между очень разными по глубине областями достаточно плавные. Поэтому авторы решили сначала увеличивать резкость изображения, чтобы края объектов были контрастными по глубине. Затем алгоритм выделяет пограничные области с помощью порога разницы в глубине. Из-за неидеальной точности карт глубины в результате образуются не только длинные границы, но и разделенные, а также отдельные артефакты внутри объектов или на фоне, поэтому после первичной разметки алгоритм удаляет артефакты и объединяет соседние длинные части границ. В результате разработчики получили алгоритм, который достаточно качественно выделяет на фотографиях объекты на разных расстояниях и заполняет области за ними более реалистично, чем аналогичные алгоритмы других разработчиков. Авторы опубликовали несколько роликов с фотографиями и перемещающимся ракурсом, а также создали интерактивную страницу, на которой можно на конкретных снимках сравнить различные версии алгоритма между собой, а также с аналогичными алгоритмами других авторов. В 2018 году разработчики из Google представили алгоритм, позволяющий создавать фотографии с новых ракурсов с реалистично заполненными пустыми областями. Он получает пару кадров с двухкамерного смартфона, разбивает изображение на множество слоев с объектами, отсортированными по глубине, а затем «пересобирает» слои для нового ракурса. Григорий Копиев Источник: nplus1.ru Комментарии: |
|