ProductNet: датасет изображений товаров от Amazon |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2019-05-05 13:43 Исследователи из Amazon опубликовали аналог датасета ImageNet для товаров. Изображения товаров систематизированы и представлены в высоком разрешении. ProductNet создан с целью улучшить обучение представлений товаров. Помимо датасета, исследователи опубликовали модель, которая автоматически размечает товары. Это позволяет сократить материальные затраты на разметку. Нейросетевой подход в 20 раз быстрее ручной разметки. ProductNet включает в себя 3900 категорий товаров, каждая из которых представлена на 40-60 изображениях. Всего продуктов в выборке около 178 тысяч. Исследователи постарались максимально диверсифицировать продукты для каждой из категорий, чтобы представления товаров, обученные на данных, были наиболее информативные. Способ построения датасета Классическим способом разметки данных является ручная разметка аннотаторами. Аннотаторы сами называют объект на изображении, затем выбирается наиболее соответствующий реальности лейбл для товара. Это крайне дорогостоящий способ разметки, в особенности в случае, когда количество уникальных товаров превышает 3 тысячи. Amazon предложил модель для автоматической разметки товаров на изображениях. ProductNet предполагает первичную ручную разметку на подвыборке данных, результаты которой используется для других неразмеченных данных. Пайплан работает следующим образом:
Результаты Amazon удалось в 20 раз сократить время, которое тратится на разметку. Модель за полчаса размечает 100 товаров, в то время как человек способен на разметку 5 товаров в указанный срок. Источник: neurohive.io Комментарии: |
|