Products-10K: датасет для распознавания продуктов

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Products-10K — это широкомасштабный датасет для распознавания продуктов. Датасет состоит из изображений потребительских товаров. Данные собирали, чтобы улучшить качество моделей для распознавания товаров на складских полках.

Проблемы прошлых датасетов

Распознавание товаров является актуальной проблемой из-за широкого разнообразия товаров и их визуального сходства. Существующие датасеты с изображениями товаров либо слишком мелкие, либо с шумной разметкой. Products-10K состоит из 10 тысяч категорий товаров, которые часто приобретают пользователи JD.com. 

Подробнее про датасет

Изображения в Product-10K собирали из фотографий онлайн-магазина и изображений пользователей. Пользователи прикрепляли изображения к комментариям к приобретенному товару.

Разные типы изображений в датасете

Категории товаров в датасете включают в себя моду, еду, здравоохранение, домохозяйственные товары и другие. Классы в датасете организованы в виде графа, который захватывает иерархические связи между продуктами и их близость. Всего в датасете около 150 тысяч изображений. Все изображения вручную проверяли и размечали эксперты из JD.com. Общий уровень шума в данных не превышает 0.5%.


Источник: neurohive.io

Комментарии: