ObjectNet: датасет с объектами, которые сложно распознать нейросети

МЕНЮ

Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ

Новости ИИ

Искусственный интеллект
Голосовой помощник
Городские сумасшедшие
ИИ в медицине
ИИ проекты
Искусственные нейросети
Слежка за людьми
Угроза ИИ

Разработка ИИ

ИИ теория
Компьютерные науки
Машинное обуч. (Ошибки)
Машинное обучение
Машинный перевод
Реализация ИИ
Реализация нейросетей
Создание беспилотных авто
Трезво про ИИ
Философия ИИ

Внедрение ИИ

Big data
Генетические алгоритмы
Капсульные нейросети
Основы нейронных сетей
Распознавание лиц
Распознавание образов
Распознавание речи
Техническое зрение
Чат-боты

Работа разума и сознание

Изучение сна
Изучение сознания
Психология
Работа головного мозга
Работа памяти
Работа разума

Модель мозга

Модель мозга

Робототехника, БПЛА

Беспилотные автомобили
БПЛА
Робототехника

Трансгуманизм

Трансгуманизм

Обработка текста

Анализ социальных сетей
Компьютерная лингвистика
Лингвистика
Поисковые алгоритмы

Теория эволюции

Головной мозг
Нейронные сети
Поведение животных
Теория эволюции

Дополненная реальность

Виртулаьная реальность
Дополненная реальность

Железо

Интернет вещей
Квантовые компьютеры
Нейронные процессоры
облачные вычисления
Суперкомпьютеры

Киберугрозы

Кибербезопасность

Научный мир

Методы исследования
Наука и образование
Семинары

ИТ индустрия

ИТ-гиганты
Новости ит

Разработка ПО

Разработка ПО
Теория алгоритмов

Теория информации

Кластеризация

Математика

Актуальная математика
Статистика
Теория вероятности
Теория информации
Теория хаоса

Цифровая экономика

Технология блокчейн
Цифровая экономика

Авторизация

RSS

RSS новости

2019-12-11 14:33

машинное обучение новости

ObjectNet — это датасет для задач компьютерного зрения. В ObjectNet нет разделения на обучающую и тестовую выборки, доступна только тестовая. С помощью датасета можно проверить обобщающую способность обученной нейросети. Созданием датасета занимались исследователи из MIT. Точность предсказаний обученных моделей падало на 40-45% при тестировании на ObjectNet.

Одной из проблем в обучении нейросетей является ограниченная способность обученной модели к генерализации. Текущие базовые датасеты для компьютерного зрения неполно отражают многообразие изображений объектов в реальном мире. Чтобы повысить способность моделей к генерализации, необходимо обучать их на более сложных и близких к реальности данных.

Что внутри данных

Исследователи собрали датасет с изображениями предметов с разных углов и с новыми задними фонами. Датасет для тестирования моделей состоит из 50 тысяч изображений. Размер ObjectNet совпадает с ImageNet. При этом отдельно контролировали разнообразие таких характеристик, как угол обзора, задний фон и повороты объекта. В ObjectNet содержатся 313 уникальных классов, которые совпадают с классами в ImageNet.

При тестировании моделей на собранном датасете исследователи заметили значительное снижение качества предсказаний. ObjectNet лучше отражает разнообразие изображений объектов в реальном мире. Кроме этого, датасет устойчив к дообучению и является сложной задачей для transfer learning.

Прост для людей, но сложный для нейросети

Ниже видно, что последние нейросетевые архитектуры на 40-45% падают в точности при тестировании на ObjectNet. ObjectNet и проще, чем ImageNet, из-за того, что объекты на изображениях находятся по центру и не перекрывают друг друга. При этом собранный датасет сложнее из-за разнообразия задних фонов, углов обзора и сторон объекта.

Сравнение точности моделей при тестировании на ImageNet и ObjectNet

Источник: neurohive.io

ObjectNet: датасет с объектами, которые сложно распознать нейросети

Комментарии: