В популярном наборе данных для самоуправляемых автомобилей отсутствуют метки для сотен пешеходов |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-02-12 19:25 Машинное обучение, процесс обучения компьютерных алгоритмов для выполнения новых задач на примере, готов к преобразованию отраслей от сельского хозяйства к страхованию . Но ML-модели могут быть только такими же хорошими, как данные, на которых они обучаются. Одной из самых популярных областей, где машинное обучение приведет к социальным изменениям, является появление самоуправляемых автомобилей. Но с большой силой приходит большая ответственность; плохо обученный самостоятельное вождение автомобиля может, в буквальном смысле слова, привести к человеческим жертвам. Вот почему мы были удивлены и обеспокоены, когда обнаружили, что популярный набор данных (5100 звезд и 1800 вилок), используемый тысячами студентов для создания автомобиля с открытым исходным кодом, содержит критические ошибки и упущения. Мы провели ручную проверку 15 000 изображений в широко используемом наборе данных Udacity Dataset 2 и обнаружили проблемы с 4986 (33%) из них. Среди них были тысячи немаркированных транспортных средств, сотни немаркированных пешеходов и десятки немаркированных велосипедистов. Мы также нашли много примеров фантомных аннотаций, дублированных ограничительных коробок и резко увеличенных ограничительных коробок. Примеры ошибок (выделенные красным цветом Примечания отсутствовали в исходном наборе данных).Возможно, самым вопиющим было то, что 217 (1,4%) изображений были полностью немаркированными, но на самом деле содержали легковые автомобили, грузовики, уличные фонари и/или пешеходов. Несколько примеров изображений, содержащих пешеходов, которые не содержат никаких примечаний в исходном наборе данных.Наборы данных с открытым исходным кодом великолепны, но если общественность собирается доверять нашему сообществу с их безопасностью, нам нужно сделать лучшую работу по обеспечению полноты и точности данных, которыми мы делимся. Если вы используете общедоступные наборы данных в своих проектах, пожалуйста, проявите должную осмотрительность и проверьте их целостность, прежде чем использовать их в дикой природе. Благодаря их разрешительному лицензированию, мы исправили и повторно выпустили набор данных Udacity self-driving car, упомянутый в этом сообщении, в нескольких форматах для использования в вашем проекте. Если вы обучали модель на оригинале, пожалуйста, подумайте о переходе к использованию этих обновленных аннотаций. Источник: www.reddit.com Комментарии: |
|