Object Detection за 10 строчек кода.

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Узнайте, какие объекты на изображении.

Изображение Pixabay

Распознавание лиц и объектов - это компьютерная технология, способная узнавать различные предметы и человеческие лица на цифровом изображении и определять их относительное местоположение.

Эта технология очень популярна благодаря широкой применимости во многих областях, включая безопасность, биометрию, правоохранительные органы, индустрию развлечений, коммерцию и многое другое. Распознавание объектов позволяет автоматизировать процессы, которые до этого делались вручную.

При этом индустрия достаточно сильно развита: разработаны десятки библиотек, обучены сотни нейронных сетей (с различными спецификациями) для быстрого и удобного использования в своих приложениях.

И сегодня мы Вам покажем, что программу для обнаружения и распознавания объектов и лиц на Python можно написать меньше, чем за 10 строк кода.

Начнем “детектить”!

Еще больше интересной информации Вы найдете в группе IT Resume, а пока что вернемся к нашей детекции!

Для начала установите (если Вы этого еще не сделали) следующие библиотеки:

  • opencv-python (библиотека алгоритмов компьютерного зрения и обработки изображений)
  • cvlib (Computer Vision library)
  • matplotlib (библиотека для создания статических и интерактивных визуализаций)
  • tensorflow (библиотека для решения задач построения и тренировки нейронной сети)

Это основные инструменты Python для работы с ИИ (хотя есть много других).

Начинаем считать строки кода с импорта необходимых библиотек Python (4). Затем чтение изображения из хранилища, потом обнаружение объектов, и в конце отображение картинки с ограничивающей рамкой и названием объектов (еще 5). Итого 9 строк:

У Вас уже есть готовый кусочек кода для обнаружения и идентификации объектов. Проверим, как он работает.

Слева - Исходное изображение, Справа - Обработанное изображение

Очень неплохо! Точность можно корректировать, подбирая различные алгоритмы и методы компьютерного зрения.

“Человека распознать - не банан от яблока отличить!” - скажете Вы.

Конечно, задача сложнее, но и с ней мы справимся быстро.

Изображение teguhjati АФР из Pixabay

Будем пользоваться теми же библиотеками, что и в предыдущем примере: opencv-python и cvlib

Проделываем все то же самое: импортируем необходимые библиотеки Python, читаем изображение из хранилища, находим лица на загруженном изображении, рисуем ограничивающие рамки вокруг лиц и выводим обработанное изображение. Код получился немного длиннее - 12 строк. Можно считать это погрешностью (±2 строки)!

А теперь давайте посмотрим на результат:

Результат распознавания лиц на изображении

Вуаля!

Теперь мы можем с легкостью находить людей на фотографиях. Это первый шаг к созданию собственного приложения, основанного на распознавании лиц! :)

Эпилог

Конечно, этот пример - всего лишь начало Вашего длинного пути в области искусственного интеллекта и компьютерного зрения, в частности. В этой области уже очень много наработок, поэтому нужно усердно работать, чтобы стать профессионалом: например, Deep Learning Engineer. Однако, это крайне интересное направление: оно находится на стыке прикладной науки и программирования и открывает перед людьми огромное количество интересных и амбициозных задач!

Еще больше интересного материала по программированию, математике, Data Science и анализу данных — в группе IT Resume.


Источник: m.vk.com

Комментарии: