ИИ научился смотреть на магические трюки по-человечески

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Испанские исследователи научили алгоритм компьютерного зрения воспринимать трюки иллюзиониста с монеткой так же, как это делает человек. Для этого они попросили профессионального иллюзиониста показать несколько фокусов зрителю и алгоритму распознавания на основе DeepLabCut, который используются для трекинга лабораторных животных. Два из семи показанных трюков смогли успешно обмануть и человека, и компьютер, а результаты работы смогут в будущем помочь в изучении восприятии подобных фокусов зрителями, пишут ученые в препринте на arXiv.org.

В магических трюках, которые показывают иллюзионисты, нет магии, весь успех их выполнения сводится к ловкости рук. С другой стороны, дело также и в человеческом восприятии: действия иллюзиониста призваны ввести зрителя в заблуждение, сыграв на его внимательности и концентрации. Поэтому для тех, кто следит за руками фокусника крайне внимательно, никакой магии нет, а обман в некоторых трюках можно легко обнаружить, если, к примеру, записать его исполнение на видео и медленно проиграть.

Разумеется, с восприятием таких трюков алгоритмами компьютерного зрения ситуация немного другая: по сути, компьютер освобожден от возможности быть обманутым, и в случае с ним то, насколько хорошо он сможет распознать обман, зависит от качества его работы. Проверить, можно ли научить подобный алгоритм смотреть на трюки иллюзионистов как человек, решили исследователи под руководством Алекса Гомеза-Марина (Alex Gomez-Marin) из Института нейронаук в Аликанте (Испания). 

Для этого ученые наняли профессионального иллюзиониста и попросили его показать семь простых визуальных трюков с монетками — без каких-либо вербальных дополнений, которые могут отвлечь зрителя и повлиять на успех иллюзии. Трюки отличались движениями руки иллюзиониста, необходимыми для исчезновения монетки: так, в одной важным было перетаскивание монетки по столу, а в другом, к примеру, — ее захват. 

Все трюки показали людям, а также алгоритму на основе DeepLabCut, который в прошлом году представили немецкие ученые: он используется для автоматического отслеживания движений лабораторных животных и может даже анализировать движения отдельных частей их тела (например, лап мышей). Задача алгоритма состояла в том, чтобы в конце каждого трюка определить местоположение монетки — точно та же задача стояла и перед участниками исследования.

Ученые сравнили результаты человека и алгоритма и выяснили, что обмануть их обоих удалось только в двух случаях. Три трюка, которые обманывали зрителей, алгоритм не обманули — положение монетки он определил. Также один трюк обманул алгоритм, но не зрителей, а один — наоборот. К примеру, четвертый трюк, в котором иллюзионист выкладывает монетки в ряд (его можно посмотреть на видео), оказался простым для алгоритма, но смог обмануть зрителя, потому что внимание последнего во время движений было направлено на руку, в которой иллюзионист изначально держал монетки, поэтому то, что фокусник кладет монетку другой рукой, осталось незамеченным. Так как у алгоритма, натренированного на отслеживание монетки, нет проблем с тем, чтобы следить за двумя руками сразу, обманут он не был. С другой стороны, в шестом трюке — точно таком же, как первый, но специально сделанном с ошибкой — алгоритм, в отличие от зрителя, не сумел распознать обман, так как подброшенная монетка, по-видимому, оказалась ребром по отношению к камере, что и вызвало трудности в распознавании у компьютера, а не у человека.

Авторы уточняют, что их не интересовала способность алгоритма быстро разгадывать трюки иллюзиониста. Скорее они хотели посмотреть на то, можно ли заставить его смотреть на них так же, как смотрит обычный человек, причем не тот, который стремится разгадать обман, а тот, который в действительности воспринимает трюк как некую магию. То, что в некоторых случаях DeepLabCut в действительности не смогла распознать обман точно так же, как и человек, значит, по мнению ученых, что подобные алгоритмы можно использовать для анализа человеческого восприятия — как раз в ситуациях, подобных трюкам иллюзионистов.

Современные технологии используются в иллюзионизме и вне исследований. К примеру, несколько лет назад компания Magic Lab использовала для одного из трюков 24 квадрокоптера: прочитать об этом вы можете здесь.

Елизавета Ивтушок


Источник: nplus1.ru

Комментарии: