ClearGrasp: нейросеть обучили распознавать прозрачные объекты |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-02-21 17:20 ClearGrasp — это нейросетевой алгоритм для представления RGB-D изображений с прозрачными объектами в 3D. Совместно с моделью разработчики опубликовали датасет с синтетическими изображениями прозрачных объектов. С помощью ClearGrasp разработчики улучшили перформанс робота-руки на задаче переноса прозрачных объектов — с 12% до 74%. Оптические 3D сенсоры, как RGB-D камеры и LIDAR, переносят изображения среды в 3D и широко применяются в робототехнике и автономных автомобилях. Несмотря на сложность сенсоров, прозрачные объекты, как стеклянные контейнеры, вносят в данные шум. Исследователи из Google AI, Synthesis AI и Columbia University разработали ClearGrasp, чтобы решить задачу корректного распознавания прозрачных объектов. Алгоритм работает с данными из RGB-D камер и использует нейросети для реконструкции глубины прозрачных объектов. Исследователи заявляют, что модель генерализуются на новые типы объектов, которых не было в тренировочных данных. Это является преимуществом над предыдущими аналоговыми моделями, которые предполагают наличие 3D моделей всех прозрачных объектов в выборке. Публичный датасет с прозрачными объектами Обучение нейросетей требует значительного количества данных. Ранее не было датасетов с 3D моделями прозрачных объектов. Существующие датасеты с 3D моделями, как Matterport3D или ScanNet, игнорируют прозрачные объекты. Это связано с тем, что процесс разметки таких объектов является затратным. Исследователи опубликовали датасет, который содержит 50,000 фотореалистичных рендеров с масками сегментации, границами и глубиной. Эти данные подходят для задач распознавания объектов в 2D и 3D. Каждое изображение содержит до 5 прозрачных объектов с различными настройками заднего фона и освещения. Что внутри ClearGrasp ClearGrasp использует 3 нейросети:
Маска используется, чтобы убрать все пиксели, которые соответствуют прозрачному объекту, а затем заполнить глубину. Глобальный модуль оптимизации расширяет глубину известной поверхности и постепенно реконструирует 3D модель изображения. Источник: neurohive.io Комментарии: |
|