Почти миллион снимков натуралистов-любителей поможет компьютеру опознать тысячи видов

2018-06-22 19:12

распознавание образов, большие данные big data

Американские разработчики представили iNat2017 — датасет для распознавания отдельных видов животных и растений, состоящих из 859 тысяч фотографий, сделанных любителями с помощью приложения iNaturalist. Обученная с помощью такого датасета нейросеть умеет распознавать как отдельные виды, так и более высокие иерархические ранги. Точность распознавания отдельных видов, как сообщается в статье, опубликованной на сайте IEEE Explore, пока что не превышает 67 процентов.

Современные компьютерные алгоритмы достаточно продвинуты в области распознавания изображений и идентификации отдельных объектов на них: к примеру, весной прошлого года появилось приложение, которые умеет распознавать произведения искусства. Качество работы подобных систем напрямую зависит от разнообразия и величины обучающей и тестовой выборки: к примеру, система распознавания лиц в местах общего пользования сможет узнавать только тех людей, изображения которых она уже видела.

Разработка приложения, которое позволило бы распознавать все биологические объекты, поэтому, — задача непростая, но очень полезная. Разработчики из Калифорнийского технического института, Google и Технологического колледжа Корнеллского университета под руководством Гранта ван Хорна (Grant Van Horn) воспользовались помощью натуралистов-любителей — пользователей приложения iNaturalist, которое позволяет делать фотографии различных живых организмов и рассказывать о них. Для каждой фотографии в приложении есть текстовое описание с названием вида и других рангов иерархической классификации (класс, надкласс и так далее). Для того, чтобы повысить качество распознавания, ученые включили только те виды, фотографий которых было как минимум 20. Итого датасет состоит из 859 тысяч изображений более 5 тысяч видов животных и растений. Каждый объект на изображениях был вручную отмечен рамочкой.

Точность распознавания для разных надклассов

Horn et al. / IEEE Xplore 2018

Часть датасета использовали для обучения известных алгоритмов глубокого обучения, используемых для распознавания объектов: в частности, например, ResNet, одна из архитектур которой недавно научила компьютер предсказывать поведение собаки. Друга часть датасета была использована в качестве тестовой выборки. В зависимости от выбранного алгоритма и надкласса особи точность распознавания достигала 92 процентов; средняя точность распознавания, однако, не превышала 60 процентов, а для распознавания отдельных видов точность не превышала 67 процентов.

Примеры распознавания отдельных видов

Horn et al. / IEEE Xplore 2018

Авторы датасета отмечают, что низкая точность распознавания с использованием iNat2017 — это его особенность. Все снимки собраны любителями: они не только достаточно низкого качества, но и сделаны на разном фоне и с разным освещением. Использование такого датасета для обучения систем автоматического распознавания особей в дальнейшем поможет идентифицировать их в похожих условиях — in situ.

Недавно исследователи из Калифорнийского института в Беркли представили DeepDrive — самый большой на сегодняшний день датасет с изображениями для обучения беспилотных автомобилей. Данные собрали из 100 тысяч видео, снятых автомобилями.

Елизавета Ивтушок

Источник: nplus1.ru



		Почти миллион снимков натуралистов-любителей поможет компьютеру опознать тысячи видов
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Голосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ Разработка ИИ ИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Внедрение ИИ Big data Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Работа разума и сознание Изучение сна Изучение сознания Психология Работа головного мозга Работа памяти Работа разума Модель мозга Модель мозга Робототехника, БПЛА Беспилотные автомобили БПЛА Робототехника Трансгуманизм Трансгуманизм Обработка текста Анализ социальных сетей Компьютерная лингвистика Лингвистика Поисковые алгоритмы Теория эволюции Головной мозг Нейронные сети Поведение животных Теория эволюции Дополненная реальность Виртулаьная реальность Дополненная реальность Железо Интернет вещей Квантовые компьютеры Нейронные процессоры облачные вычисления Суперкомпьютеры Киберугрозы Кибербезопасность Научный мир Методы исследования Наука и образование Семинары ИТ индустрия ИТ-гиганты Новости ит Разработка ПО Разработка ПО Теория алгоритмов Теория информации Кластеризация Математика Актуальная математика Статистика Теория вероятности Теория информации Теория хаоса Цифровая экономика Технология блокчейн Цифровая экономика Авторизация RSS RSS новости		2018-06-22 19:12 распознавание образов, большие данные big data Американские разработчики представили iNat2017 — датасет для распознавания отдельных видов животных и растений, состоящих из 859 тысяч фотографий, сделанных любителями с помощью приложения iNaturalist. Обученная с помощью такого датасета нейросеть умеет распознавать как отдельные виды, так и более высокие иерархические ранги. Точность распознавания отдельных видов, как сообщается в статье, опубликованной на сайте IEEE Explore, пока что не превышает 67 процентов. Современные компьютерные алгоритмы достаточно продвинуты в области распознавания изображений и идентификации отдельных объектов на них: к примеру, весной прошлого года появилось приложение, которые умеет распознавать произведения искусства. Качество работы подобных систем напрямую зависит от разнообразия и величины обучающей и тестовой выборки: к примеру, система распознавания лиц в местах общего пользования сможет узнавать только тех людей, изображения которых она уже видела. Разработка приложения, которое позволило бы распознавать все биологические объекты, поэтому, — задача непростая, но очень полезная. Разработчики из Калифорнийского технического института, Google и Технологического колледжа Корнеллского университета под руководством Гранта ван Хорна (Grant Van Horn) воспользовались помощью натуралистов-любителей — пользователей приложения iNaturalist, которое позволяет делать фотографии различных живых организмов и рассказывать о них. Для каждой фотографии в приложении есть текстовое описание с названием вида и других рангов иерархической классификации (класс, надкласс и так далее). Для того, чтобы повысить качество распознавания, ученые включили только те виды, фотографий которых было как минимум 20. Итого датасет состоит из 859 тысяч изображений более 5 тысяч видов животных и растений. Каждый объект на изображениях был вручную отмечен рамочкой. Точность распознавания для разных надклассов Horn et al. / IEEE Xplore 2018 Часть датасета использовали для обучения известных алгоритмов глубокого обучения, используемых для распознавания объектов: в частности, например, ResNet, одна из архитектур которой недавно научила компьютер предсказывать поведение собаки. Друга часть датасета была использована в качестве тестовой выборки. В зависимости от выбранного алгоритма и надкласса особи точность распознавания достигала 92 процентов; средняя точность распознавания, однако, не превышала 60 процентов, а для распознавания отдельных видов точность не превышала 67 процентов. Примеры распознавания отдельных видов Horn et al. / IEEE Xplore 2018 Авторы датасета отмечают, что низкая точность распознавания с использованием iNat2017 — это его особенность. Все снимки собраны любителями: они не только достаточно низкого качества, но и сделаны на разном фоне и с разным освещением. Использование такого датасета для обучения систем автоматического распознавания особей в дальнейшем поможет идентифицировать их в похожих условиях — in situ. Недавно исследователи из Калифорнийского института в Беркли представили DeepDrive — самый большой на сегодняшний день датасет с изображениями для обучения беспилотных автомобилей. Данные собрали из 100 тысяч видео, снятых автомобилями. Елизавета Ивтушок Источник: nplus1.ru Комментарии:

Почти миллион снимков натуралистов-любителей поможет компьютеру опознать тысячи видов

Комментарии: