ProductNet: датасет изображений товаров от Amazon |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2019-05-05 13:43 Исследователи из Amazon опубликовали аналог датасета ImageNet для товаров. Изображения товаров систематизированы и представлены в высоком разрешении. ProductNet создан с целью улучшить обучение представлений товаров. Помимо датасета, исследователи опубликовали модель, которая автоматически размечает товары. Это позволяет сократить материальные затраты на разметку. Нейросетевой подход в 20 раз быстрее ручной разметки. ProductNet включает в себя 3900 категорий товаров, каждая из которых представлена на 40-60 изображениях. Всего продуктов в выборке около 178 тысяч. Исследователи постарались максимально диверсифицировать продукты для каждой из категорий, чтобы представления товаров, обученные на данных, были наиболее информативные. Способ построения датасета Классическим способом разметки данных является ручная разметка аннотаторами. Аннотаторы сами называют объект на изображении, затем выбирается наиболее соответствующий реальности лейбл для товара. Это крайне дорогостоящий способ разметки, в особенности в случае, когда количество уникальных товаров превышает 3 тысячи. Amazon предложил модель для автоматической разметки товаров на изображениях. ProductNet предполагает первичную ручную разметку на подвыборке данных, результаты которой используется для других неразмеченных данных. Пайплан работает следующим образом:
Результаты Amazon удалось в 20 раз сократить время, которое тратится на разметку. Модель за полчаса размечает 100 товаров, в то время как человек способен на разметку 5 товаров в указанный срок. Телеграм: t.me/ainewsline Источник: neurohive.io Комментарии: |
|