Классификация изображения по признакам и распознавание личности актрисы по лицу на кадре из видеоролика. Иллюстрация: PornHub
Порноиндустрия всегда была двигателем технологического прогресса. Продолжает такой оставаться и сейчас. Например, один из самых посещаемых в мире сайтов PornHub (суточная аудитория 80 млн человек) готовится внедрить систему машинного зрения, пишет TechCrunch. Система автоматически обрабатывает и распределяет по рубликам миллионы видеороликов.
Для удобной навигации по сайту все видеоролики классифицированы по различным признакам, в том числе по имени актрисы, типу происходящего сюжета, тематике видеоролика и так далее. Раньше всю работу по классификации выполняли люди — модераторы. Но количество любительских и профессиональных видеороликов быстро увеличивается. И вот PornHub вместо того, чтобы нанять новых модераторов и платить им за просмотр NSFW, запускает работу систему машинного зрения, которая будет работать круглосуточно и не требует зарплату.
«В конечном итоге мы хотим предоставить нашим фанатам всё, что они предпочитают увидеть, и наша новая модель будет способна выдавать более точные результаты. Надеемся, что благодаря этому они будут возвращаться, чтобы увидеть ещё больше, — сказал Кори Прайс (Corey Price), вице-президент PornHub. — Речь идёт о постоянном обновлении нашей платформы, о предоставлении нашим фанам доступа к самым последним технологиям».
Распознавание положения актрисы (позы) в кадре. Иллюстрация: PornHub
Система компьютерного зрения может распознать конкретных актёров и актрис в кадре, а также их позиции и другие атрибуты. Видеоролик помечается соответствующими тегами и доступен для удобного поиска. Как показали на демонстрации, система работает буквально в реальном времени. Вполне возможно, что распознавание и пометка тегами будет осуществляться непосредственно во время загрузки контента на сайт. При демонстрации новой системы личность одного актёра была распознана даже при съёмке сбоку.
Пока что модель обучена на 50 000 тематических видеороликов, в том числе любительских. «Мы планируем просканировать всю библиотеку в начале 2018 года, — сказал Прайс. — Если вкратце, то технология будет распознавать различные позы секса и категории и сможет проставлять соответствующие теги». Вся библиотека PornHub содержит 5 млн видеороликов.
Модель машинного зрения на PornHub
Распознавание поз в сексе — это относительно новое применение системы машинного зрения. Кажется, научных работ на эту тему ещё не выходило, так что PornHub — в определённом смысле первопроходец в этой области научно-тезхнического прогресса. А вот в распознавании лиц нет ничего особенного: такие системы существуют давно. Здесь работа облегчается тем, что количество актрис ограничено (порноактрис на PornHub более 10 000), так что система должна работать более точно, чем распознавание произвольных лиц в метро через FindFace и другие подобные сервисы. Кори Прайс говорит, что система работает довольно точно.
Кроме всего прочего, система машинного зрения поможет бороться с пиратством видеороликов. Пираты часто крадут интеллектуальную собственность PornHub и размещают на других сайтах типа YouPorn, xvideos, xHamster и др. Теперь же можно внедрить систему вроде ContentID, которая работает на YouTube.
Модель машинного зрения на PornHub
Можно представить, какие новые функции могут появиться на PornHub в будущем, когда система машинного зрения у них станет более продвинутой. Возможно, на сайт можно будет загрузить произвольную фотографию любой знакомой или незнакомой девушки — а PornHub найдёт видео с актрисой, которая максимально похожа на неё. В принципе, такую функциональность можно запустить уже сейчас, технологии вполне позволяют. Более того, на сайте видеочатов Megacams уже предоставляется такая услуга. В принципе, можно сделать плагин для браузера, чтобы на страницах девушек «ВКонтакте» или на Facebook сразу стояли ссылки на соответствующие видеоролики.
И наоборот — под групповым видео сразу проставить ссылки на соответствующие профили людей в Facebook, Twitter, LinkedIn и т. д., где они уже под настоящими именами.
Может быть, по мере обучения система научится составлять текстовые аннотации сюжетов. Кто знает, вдруг для экономии времени кому-то удобнее не смотреть фильм целиком, а просто прочитать описание дальнейших событий в текстовом виде.
Ну и с учётом того, что система теперь точно распознаёт позы на видео, ожидаем новой интересной статистики от PornHub по каждой стране и даже по каждому городу, откуда закачивают любительское видео.
Может быть, в будущем ИИ научится составлять собственные видеофильмы из фрагментов разных видеороликов, используя высокую оценку зрителей как положительный стимул при обучении нейросети. Есть много идей, как применять машинное зрение в этой области.