TensorMask: instance сегментация плотно расположенных объектов

МЕНЮ

Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ

Новости ИИ

Искусственный интеллект
Голосовой помощник
Городские сумасшедшие
ИИ в медицине
ИИ проекты
Искусственные нейросети
Слежка за людьми
Угроза ИИ

Разработка ИИ

ИИ теория
Компьютерные науки
Машинное обуч. (Ошибки)
Машинное обучение
Машинный перевод
Реализация ИИ
Реализация нейросетей
Создание беспилотных авто
Трезво про ИИ
Философия ИИ

Внедрение ИИ

Big data
Генетические алгоритмы
Капсульные нейросети
Основы нейронных сетей
Распознавание лиц
Распознавание образов
Распознавание речи
Техническое зрение
Чат-боты

Работа разума и сознание

Изучение сна
Изучение сознания
Психология
Работа головного мозга
Работа памяти
Работа разума

Модель мозга

Модель мозга

Робототехника, БПЛА

Беспилотные автомобили
БПЛА
Робототехника

Трансгуманизм

Трансгуманизм

Обработка текста

Анализ социальных сетей
Компьютерная лингвистика
Лингвистика
Поисковые алгоритмы

Теория эволюции

Головной мозг
Нейронные сети
Поведение животных
Теория эволюции

Дополненная реальность

Виртулаьная реальность
Дополненная реальность

Железо

Интернет вещей
Квантовые компьютеры
Нейронные процессоры
облачные вычисления
Суперкомпьютеры

Киберугрозы

Кибербезопасность

Научный мир

Методы исследования
Наука и образование
Семинары

ИТ индустрия

ИТ-гиганты
Новости ит

Разработка ПО

Разработка ПО
Теория алгоритмов

Теория информации

Кластеризация

Математика

Актуальная математика
Статистика
Теория вероятности
Теория информации
Теория хаоса

Цифровая экономика

Технология блокчейн
Цифровая экономика

Авторизация

RSS

RSS новости

2019-10-30 14:15

распознавание образов

TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов, TensorMask сегментирует объекты с средней точностью (AP) в 37.1% на датасете COCO. При этом state-of-the-art модель Mask R-CNN работает с AP в 38.3%.

Метод скользящего окна в последнее время начал набирать популярность для распознавания границ объектов. Этот метод позволяет точно распознать объекты за одну итерацию без необходимости дополнительно уточнять границы объектов. Несмотря на это, такой подход не был эффективен для задачи instance сегментации. Это связано с тем, что instance маски представляют собой сложные двухмерные геометрические фигуры, а не прямоугольники. В TensorMask используются четырехмерные тензоры для эффективного представления масок.

Как это работает

Четырехмерные тензоры состоят из подтензоров, оси которых представляют блоки пикселей. Подтензоры позволяют использовать геометрически значимые операции. Например, трансформации координат, апскейлинг, даунскейлинг и пирамиды для масштабирования. Предыдущие попытки использования многомерных тензоров, как DeepMask, использовали неструктурированные 3D тензоры, которые не имели прямой геометрической интерпретации. Это результировало в сложности манипулирования представлениями.

Чтобы генерировать маски в скользящих окнах, исследователи используют различные представления тензоров. В этих представлениях подтензоры содержат параметры маски. Предыдущие подходы к представлению масок либо менее эффективны, либо склонны к производству артефактов. TensorMask наиболее справляется с плотными перекрывающимися объектами на изображении.

Сравнение подходов, которые используют представления масок

Почему это важно

TensorMask развивает отличный от стандартного подход к instance сегментации. С TensorMask использование боксов больше не необходимо для точного instance сегментирования объектов на изображении.

Источник: neurohive.io



		TensorMask: instance сегментация плотно расположенных объектов
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Психология Работа головного мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовые компьютеры Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2019-10-30 14:15 распознавание образов TensorMask — это алгоритм instance сегментации для распознавания плотно расположенных объектов на изображении. Нейросеть использует метод скользящего окна для сегментации объектов. Разработкой алгоритма занимались исследователи из FAIR. По результатам экспериментов, TensorMask сегментирует объекты с средней точностью (AP) в 37.1% на датасете COCO. При этом state-of-the-art модель Mask R-CNN работает с AP в 38.3%. Метод скользящего окна в последнее время начал набирать популярность для распознавания границ объектов. Этот метод позволяет точно распознать объекты за одну итерацию без необходимости дополнительно уточнять границы объектов. Несмотря на это, такой подход не был эффективен для задачи instance сегментации. Это связано с тем, что instance маски представляют собой сложные двухмерные геометрические фигуры, а не прямоугольники. В TensorMask используются четырехмерные тензоры для эффективного представления масок. Как это работает Четырехмерные тензоры состоят из подтензоров, оси которых представляют блоки пикселей. Подтензоры позволяют использовать геометрически значимые операции. Например, трансформации координат, апскейлинг, даунскейлинг и пирамиды для масштабирования. Предыдущие попытки использования многомерных тензоров, как DeepMask, использовали неструктурированные 3D тензоры, которые не имели прямой геометрической интерпретации. Это результировало в сложности манипулирования представлениями. Чтобы генерировать маски в скользящих окнах, исследователи используют различные представления тензоров. В этих представлениях подтензоры содержат параметры маски. Предыдущие подходы к представлению масок либо менее эффективны, либо склонны к производству артефактов. TensorMask наиболее справляется с плотными перекрывающимися объектами на изображении. Сравнение подходов, которые используют представления масок Почему это важно TensorMask развивает отличный от стандартного подход к instance сегментации. С TensorMask использование боксов больше не необходимо для точного instance сегментирования объектов на изображении. Источник: neurohive.io Комментарии:

TensorMask: instance сегментация плотно расположенных объектов

Комментарии: