Советы по глубокому обучению: распознавание объектов в 10 строк |
||||||||||||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2018-07-09 11:00 алгоритмы машинного обучения, реализация нейронной сети, распознавание образов, системы технического зрения Редакция Библиотеки программиста подготовила советы по глубокому обучению на примере компьютерного зрения и распознавания объектов. Введение Компьютерное зрение – это наука о компьютерах и программных системах, которые могут распознавать и понимать изображения. Оно является одной из важных областей искусственного интеллекта и состоит из различных аспектов, таких как распознавание изображения, обнаружение предмета, классификация / генерация изображения и т. д. Обнаружение объектов, вероятно, является наиболее важным аспектом компьютерного зрения. Обнаружение предмета широко применяется в таких областях:
Существует масса способов обнаружения объектов, которые могут быть использованы в различных областях. Как и любая другая компьютерная технология, широкий спектр творческого применения зависит от разработчиков программного обеспечения. Прорыв в 2012 году позволил создать такие мощные методы, как R-CNN, Fast-RCNN, Faster-RCNN, RetinaNet, быстрые и очень точные SSD и YOLO. Использование этих методов и алгоритмов, основанных на глубоком обучении, требует серьезных знаний в математике и понимание фреймворков глубокого обучения. Начнем Рассматривать советы по глубокому обучению мы начнем с компьютерного зрения и Python-библиотеки ImageAI, позволяющей легко интегрировать современные технологии компьютерного зрения в свои существующие и новые приложения. Установка Python Необходимо установить Python 3 с официального сайта. Установка зависимостей Следующий шаг – установка зависимостей через pip:
Retina Net Загрузите файл модели Retina Net, который будет использоваться для обнаружения объектов. После установки зависимостей мы продолжаем разбирать советы по глубокому обучению и приступаем к написанию первого кода для обнаружения объектов. Создайте файл FirstDetection.py, а затем впишите в него приведенный ниже код. Скопируйте файл новой модели Retina и изображение, которое требуется обработать, в папку, содержащую файл Python. Тестирование
Запустите код и подождите результатов в консоли. После этого перейдите в папку, в которой расположен FirstDetection.py – там вы найдете новое изображение. Давайте посмотрим на оба изображения: Результаты, обнаружения для картинки: person : 55.8402955532074 Результаты, обнаружения для картинки: person : 71.10445499420166 Теперь разберемся, как работает этот код.
ImageAI поддерживает массу настроек процесса обнаружения объектов. Одной из них является возможность извлечения каждого объекта, обнаруженного на изображении. Класс обнаружения объектов создаст папку image, извлечет, сохранит и вернет массив, содержащий путь к каждому из изображений.
Советы по глубокому обучению завершает список возможностей ImageAI, т. к. кроме элементарного обнаружения он умеет еще кое-что:
Источник: proglib.io Комментарии: |
|||||||||||