В популярном наборе данных для самоуправляемых автомобилей отсутствуют метки для сотен пешеходов

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Машинное обучение, процесс обучения компьютерных алгоритмов для выполнения новых задач на примере, готов к преобразованию отраслей от сельского хозяйства к страхованию . Но ML-модели могут быть только такими же хорошими, как данные, на которых они обучаются.

Одной из самых популярных областей, где машинное обучение приведет к социальным изменениям, является появление самоуправляемых автомобилей. Но с большой силой приходит большая ответственность; плохо обученный самостоятельное вождение автомобиля может, в буквальном смысле слова, привести к человеческим жертвам.

Вот почему мы были удивлены и обеспокоены, когда обнаружили, что популярный набор данных (5100 звезд и 1800 вилок), используемый тысячами студентов для создания автомобиля с открытым исходным кодом, содержит критические ошибки и упущения.

Мы провели ручную проверку 15 000 изображений в широко используемом наборе данных Udacity Dataset 2 и обнаружили проблемы с 4986 (33%) из них. Среди них были тысячи немаркированных транспортных средств, сотни немаркированных пешеходов и десятки немаркированных велосипедистов. Мы также нашли много примеров фантомных аннотаций, дублированных ограничительных коробок и резко увеличенных ограничительных коробок.

Примеры ошибок (выделенные красным цветом Примечания отсутствовали в исходном наборе данных).

Возможно, самым вопиющим было то, что 217 (1,4%) изображений были полностью немаркированными, но на самом деле содержали легковые автомобили, грузовики, уличные фонари и/или пешеходов.

Пропавшие пешеходы в Удмуртии самостоятельно управляют автомобилем
Несколько примеров изображений, содержащих пешеходов, которые не содержат никаких примечаний в исходном наборе данных.

Наборы данных с открытым исходным кодом великолепны, но если общественность собирается доверять нашему сообществу с их безопасностью, нам нужно сделать лучшую работу по обеспечению полноты и точности данных, которыми мы делимся. Если вы используете общедоступные наборы данных в своих проектах, пожалуйста, проявите должную осмотрительность и проверьте их целостность, прежде чем использовать их в дикой природе.

Благодаря их разрешительному лицензированию, мы исправили и повторно выпустили набор данных Udacity self-driving car, упомянутый в этом сообщении, в нескольких форматах для использования в вашем проекте. Если вы обучали модель на оригинале, пожалуйста, подумайте о переходе к использованию этих обновленных аннотаций.


Источник: www.reddit.com

Комментарии: