BlendMask: нейросеть обходит state-of-the-art на задаче сегментации объектов |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-01-08 13:51 BlendMask — это нейросетевая модель для instance сегментации объектов на изображении. Модель выдает более точные границы объектов, чем Mask R-CNN, на COCO датасете при схожих параметрах обучения. При этом BlendMask работает на 20% быстрее. Instance сегментация — одна из основных задач компьютерного зрения. В последнее время для решения этой задачи стали популярны полноценно сверточные нейросети. Их преимущество заключается в простоте и эффективности в сравнении с двухступенчатыми подходами, как Mask R-CNN. Предложенная модель более точно предсказывает маски объектов, чем state-of-the-art подходы. BlendMask комбинирует информацию на уровне отдельных объектов и семантическую информацию для предсказания маски объекта. Ключевое отличие BlendMask от предыдущих подходов — blender модуль, который вдохновлен снизу-вверх и сверху-вниз подходами для instance сегментации. Blender модуль является ключевой составляющей архитектуры BlendMask. Блок выучивает информацию об отдельных объектах изображения и признаки пикселей. Как это работает BlendMask выучивает карты внимания объектов за один сверточный слой, что делает ее быстрой при использовании в продукте. Модель можно внедрить в любой одноступенчатый фреймворк для распознавания объектов. Модель по метрикам обходит Mask R-CNN при обучении со схожими параметрами. При этом BlendMask обучается на 20% быстрее. Предложенная BlendMask архитектура состоит из нейросети для распознавания объекта и блока для предсказания маски объекта. Блок для предсказания маски состоит из трех частей:
Модель основывается на FCOS архитектуре для детектирования объектов. FCOS подход основывается на полностью сверточной одноступенчатой архитектуре. Нижний модуль использует либо базовую нейросеть (backbone), либо признаки из FPN для предсказания набора баз объектов. Поверх модуля с детектированием добавляется однослойная нейросеть, которая выдает карты внимания и предсказания границ объектов. Для каждого предсказанного объекта blender модуль обрезает базы по предсказанным границам объекта и линейно комбинирует их с помощью выученных карт внимания. Тестирование работы модели Исследователи сравнили работу BlendMask с Mask R-CNN и TensorMask. Ниже видно, что на COCO датасете BlendMask выдает предсказания масок объектов с mAP 37%. Источник: neurohive.io Комментарии: |
|