Что может сказать нейронная сеть о ваших рисунках?

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Никто не анализирует рисунки (здесь и далее имеются в виду схематичные рисунки от руки, которые в английском называются doodles — прим. перев.). Если ваш друг нарисует что-то вроде этого:


Вы скажете "Хаха, ты такой забавный!" или "Чувак, тебе нужна практика!" Ладно, если автор рисунка вам очень нравится, вы можете пуститься в обсуждение глубоких чувств, которые кроются за этой улыбающейся собакой. Ну и все на этом.

А вообще, часто вы видите рисунки других людей? Возможно, вы знаете как рисуют близкие друзья, потому что вместе играли в ассоциации на бумаге. Или видели рисунки коллег, которые они в шутку вставляют в презентации друг друга.

Единственный рисунок, который мы видим более-менее часто — это мужские гениталии на соседнем гараже. Тут особо нечего анализировать.

Но все меняется.

Уверен, многие из вас слышали об игре "Quick, Draw!" от Google, которая распознает ваши рисунки. Когда игра стала вирусной, люди нарисовали в ней тысячи, если не миллионы рисунков.


Уверен, многие из вас слышали об игре "Quick, Draw!" от Google, которая распознает ваши рисунки. Когда игра стала вирусной, люди нарисовали в ней тысячи, если не миллионы рисунков.

Есть лишь одна проблема.

Google не показывает нам все рисунки. Он показывает лишь 15?20 из них. К тому же, вам сообщают только получилось ли распознать ваш рисунок или нет. А что если бы Google мог сообщить нам больше? Может быть в будущем. Но не сейчас.


Пятнадцати рисунков достаточно, чтобы хорошенько посмеяться или поднять свою самооценку, но недостаточно для полной картины.

Что если можно было бы узнать, сколько людей рисовали бумеранг с похмелья? Кто из них был зол? Кто левша? Мы могли бы получить ответы на эти вопросы, проанализировав сотни рисунков и выявив паттерны. Но у нас нет доступа к рисункам.

Статья вполне могла закончиться здесь, на этой грустной ноте сожаления об упущенной возможности.

Однако, как в любом хорошем голливудском фильме, за углом нас поджидает судьбоносное совпадение. Наша компания, Icons8, разработала точно такую же игру с рисунками, вот только представили мы ее не как игру.

Прежде чем вы начнете обвинять нас в том, что мы содрали идею с Google, скажу: наша версия вышла на нашем сайте на 2 месяца раньше.

Я не открою вам Америку, если скажу, что "Quick, Draw!" — это не совсем игра, а нейронная сеть, которая учится распознавать визуальные образы. И наш проект работает по тому же принципу. Мы просто позиционировали его не как игру, а как визуальный поиск иконок.


И точно так же, как "Quick, Draw", наша нейронная сеть с каждым новым рисунком училась все лучше и лучше различать предметы.

Идея была в том, чтобы люди могли искать иконки не по словам, а по схематичным рисункам. Вместо того, чтобы вводить "домой" или "меню", можно просто нарисовать, как вы себе представляете нужную иконку, и нейронная сеть предложит подходящие варианты.

Однако, у нашей нейронной сети не было ни игровой составляющей (никакой шкалы успеха), ни социальной (нет кнопок соц. сетей, нельзя поделиться с друзьями), так что вирусной она так и не стала. Мы просто отправили рассылку с просьбой нарисовать для нас разные штуки — и люди нарисовали. Всего у нас набралось 45,621 рисунок. Животные, средства передвижения, иконки, гаджеты — всякая всячина.

Так случилось, что я увидел эти рисунки. Не 15 похожих рисунков, которые показывает Google — я видел сотни.

Кроме того, что большой любитель поботанить в аналитике, я еще и с самого колледжа изучал связь рисования с наукой. Так что, когда меня оставили со всеми этими рисунками, я не смог устоять.

Я потратил три недели, анализируя рисунки, наблюдая, выявляя паттерны. И мне удалось найти несколько. Этих паттернов вполне достаточно, чтобы провести более глубокий анализ того, какие мыслительные процессы стоят за рисованием и как в этот момент работает мозг. В итоге нейронные сети могли бы сделать похожие выводы или исправить мои. Чтобы продемонстрировать свои выводы, я возьму для примера самую разнообразную и широкую категорию — рисунки животных.

Как люди рисуют слонов

Обычно люди не очень хорошо рисуют животных. Да и с чего бы рисовать их хорошо? Чтобы научиться этому, нужно время — поэтому обычно мы изображаем их стереотипно.

[овалы, конечности-черточки, пририсовывание отдельных частей “где-то здесь”] Стереотип “пририсую где-то здесь” — самый интересный. Человек копирует две крупные части целого, но левое полушарие мозга обозначает их по-отдельности как “хобот” и “тело”, а потом пытается каким-то образом объединить.

[овалы, конечности-черточки, пририсовывание отдельных частей "где-то здесь"] Стереотип "пририсую где-то здесь" — самый интересный. Человек копирует две крупные части целого, но левое полушарие мозга обозначает их по-отдельности как "хобот" и "тело", а потом пытается каким-то образом объединить.

Почему мы используем эти стереотипы? Бетти Эдвардс подробно объясняет это в своей книге "Правополушарное рисование". Вкратце, наш мозг состоит из двух полушарий: левого и правого. Левое и правое полушария действуют по-разному: они по-разному воспринимают информацию и по-разному ее обрабатывают.

Это влияет в том числе и на рисование. Если я попрошу вас срисовать лошадь с картинки, результат будет зависеть от того, каким полушарием вы для этого воспользуетесь.


Левое полушарие — аналитическое, логическое. Оно упрощает и структурирует информацию, а затем маркирует ее, чтобы было быстрее и проще воспользоваться ею при необходимости. Короче говоря, оно берет лошадь, разбивает на части (голова, ноги и тело) и упрощает эти части до овалов и черточек (см. картинку выше).

В итоге рисование становится стереотипным — а эти стереотипы очень устойчивы.

Если человек однажды приобрел стереотип, он может пользоваться им всю свою жизнь: всегда рисовать одну и ту же лошадку.


[Пожалуйста, нарисуйте лошадь. Возраст 10 лет. Возраст 20 лет. Возраст 30 лет. Возраст 40 лет. "Ой, да идите вы"]

Правое полушарие отвечает за наблюдения и интуицию. Оно видит предметы в точности такими, какие они есть в реальности. В правом полушарии нет слов и нет маркировки. Ни голов, ни ног — только изогнутые линии и контуры. В режиме правого полушария можно очень точно скопировать изображение.

Когда я работал в режиме левого полушария, получался только Саб-Зиро из детства (до двадцати лет именно так я рисовал людей). Можно развить у себя навык переключения между полушариями — правый силуэт тоже рисовал я.

Когда я работал в режиме левого полушария, получался только Саб-Зиро из детства (до двадцати лет именно так я рисовал людей). Можно развить у себя навык переключения между полушариями — правый силуэт тоже рисовал я.

Опытные художники могут осознанно переключаться между полушариями — они создают структуру на основании стереотипов при помощи левого полушария (простые геометрические формы), а потом воссоздают более сложные части рисунка "с натуры" при помощи правого полушария.

Но то опытные художники. А неопытные люди по умолчанию используют левое полушарие. Речь, логическое мышление, вычисления, структурирование информации — большинство повседневных задач задействуют левое полушарие. Поэтому если попросить неопытного человека нарисовать что-то по памяти, большинство воспользуются левым полушарием. Именно поэтому 95% рисунков строятся на стереотипах, сформированных давным-давно:

Так могут выглядеть ваши стены, если вы водили детей в зоопарк.

Так могут выглядеть ваши стены, если вы водили детей в зоопарк.

Но что будет, если сначала показать людям образец? Есть три возможных сценария:


[Копирование в "правом" режиме. Смешанный. Что-то своё.]

Копирование в "правом" режиме: люди переключаются на правое полушарие и довольно точно копируют образец.
Смешанный: люди начинают копировать контуры и крупные формы при помощи правого полушария, но где-то в процессе "левый" режим вступает в игру, и они начинают пользоваться стереотипами. Они "пририсуют хобот где-то в районе головы" или добавят 4 параллельных ноги.
Что-то своё: Каким бы ни был образец, люди нарисуют по-своему. Это всегда "отрепетированный" стереотипный рисунок, который они освоили уже давно. То есть работает левое полушарие.

Я проанализировал около 70 рисунков слонов. Вот диаграмма:


["Правый" режим. Смешанный. Что-то своё.]

Большинство людей воспользовались образцом и переключились на "правый" режим. Поэтому их рисунки получились более точными. Но вот в чем вся штука. У других животных дела обстоят иначе. Давайте рассмотрим весь зоопарк.


[Слоны. Свиньи. Черепахи. Лошади. Кошки. Собаки.
"Правый" режим. Смешанный. Что-то своё.]

Тут много всего, давайте рассмотрим подробнее.

Чем больше люди знают, тем хуже рисуют

Почему люди копируют слонов в "правом" режиме значительно чаще, чем других животных? Вопрос заставил меня задуматься. Сначала я решил, что слон, должно быть, уникальная экзотичная форма. Но опять же, черепахи тоже экзотичны. И у лошадей достаточно необычная форма.

И тут до меня дошло. Черепахи для нас — никакая не экзотика. Мы отлично их знаем. Или думаем, что знаем.


Люди все чаще заводят дома черепашек и поросят — так что мы все чаще видим этих животных. Дело не в том, что люди знают что-то, а в том, что они думают, что знают. Чем больше мы думаем, что знаем как выглядят черепахи и свиньи, тем больше стереотипов о них формируем. Мы игнорируем образец и рисуем, основываясь на этих стереотипах.

И это мы еще не говорим о кошках, собаках и лошадях. Лошади встречаются в каждом втором фильме, а кошки и собаки вообще повсюду. Поэтому их чаще всего рисуют в смешанном режиме, или люди используют для них какой-то свой, подготовленный рисунок.

Слоны не очень-то в моде. Мы не так много о них знаем, не часто их видим (кто-нибудь, назовите свежий фильм о слонах? Книга Джунглей? Александр? 90% персонажей в мультфильмах Кунг-фу Панда — свиньи).

Тот факт, что форма слона нам не знакома, заставляет включить режим наблюдения, перейти в "правый" режим и скопировать рисунок с образца.

Существует масса социально-психологических экспериментов, которые доказывают, что люди, не зная как действовать в определенной ситуации, обычно следуют внешнему примеру. Здесь та же история.

Итог:
Чем у вас больше предполагаемых знаний о чем-то, тем выше вероятность, что вы будете рисовать стереотипно.

В этом есть и положительная сторона. Поскольку люди рисуют разных животных по-разному, можно сделать вывод, что мы можем научиться рисовать лучше, работая над своими стереотипами и намеренно переключаясь в нужный режим.

Эмоции

Когда мы говорим об эмоциях в искусстве, многие представляют себе яростного художника, который кромсает холст с красными глазами и сумасшедшим оскалом. Это известный стереотип. Правда в том, что правое полушарие довольно миролюбивое.

А вот левое — нет. Когда люди рисуют левым полушарием, они буквально транслируют эмоции в свои рисунки. Посмотрите:


Все эти рисунки — стереотипные. Все они нарисованы при помощи левого полушария. Но сравните линии: у свиней они такие резкие, незаконченные — словно рисовали второпях. А у слонов формы гладкие, плавные и нейтральные.

Поскольку все рисунки выполнялись мышкой, можно сделать вывод, что это не простое совпадение, а паттерн.

Самые "резкие" и эмоциональные рисунки я заметил среди свиней, кошек-собак и лошадей. Такое ощущение, что люди испытывали определенные эмоции по отношению к рисункам — всегда по разным причинам. В некоторых случаях эмоции были позитивными, а в некоторых — негативными.

Лошади

Мне кажется, что самая частая эмоция здесь — отчаяние.

Прекрасно понимаю последний рисунок. У меня тоже все еще проблемы с лошадями.

Прекрасно понимаю последний рисунок. У меня тоже все еще проблемы с лошадями.

Чаще всего люди впадают в отчаяние, когда рисуют лошадь. Так, словно попытка с самого начала была обречена на провал — несмотря на то, что перед глазами был образец.

Я уже говорил, что стереотипы очень устойчивы, но кажется, что и эмоции относительно какого-либо рисунка могут быть столь же устойчивы. Я не видел, чтобы люди вели себя подобным образом, рисуя других животных.

Свиньи

Свинья в нашем обществе — очень противоречивое животное. Кто-то считает свиней милыми домашними питомцами, а для других это грязное животное. Иногда это даже оскорбление. Сами посмотрите, где какая свинья.


А еще, если снова взглянете на сравнительную диаграмму, то заметите, что свиньи лидируют в разделе "что-то свое". Однако, эти "свои" рисунки не очень то разнообразны. Большинство из них выглядит так:


И все же есть категория, в которой даже "свои" рисунки выглядят по-разному.

Кошки и собаки

Категория "кошки и собаки" — самая противоречивая из всех. Там есть и красивые рисунки и резкие, стереотипные каракули. Словно общество и вправду делится на любителей кошек и любителей собак.

Вот эти люди точно любят кошек:


А эти — ненавидят.


Кажется, что эмоции и стереотипы тесно связаны между собой. Эмоции влияют на наши рисунки, когда мы находимся в "левом" режиме. Именно поэтому мы так стараемся исключить эмоции из свои логичных, деловых решений, которые принимаем в левом полушарии.

Ситуация повторяется с собаками. Небрежные, беспорядочные линии выдают отношение автора.


А как понять, что автор любит собак? Или кошек? Дело тут только в стереотипах или качестве линий.

Они им рисуют улыбки.

Итог:
Чем более сильные эмоции (ненависть, отчаяние, любовь) испытывают люди — по отношению к объекту или к самим себе (как в примере с рисованием лошади) — тем вероятнее, что они переключатся на левое полушарие и начнут рисовать стереотипно, полностью игнорируя образец.

Заключение

В настоящее время нейронные сети вроде "Quick, Draw" все еще учатся распознавать рисунки людей. И это лишь начало. Скоро они смогут их анализировать. Примерно так же, как сделал я, но на основании большего количества данных. Надеюсь, что мои выводы окажутся полезны и будут использованы в более продвинутых нейронных сетях. Я уверен, что в рисунках людей кроется нечто большее, чем простой бинарный ответ типа "похоже-непохоже" или "хорошо-плохо".

А пока, есть столько всего, чему можно поучиться у этих сетей! Так что в следующий раз, когда ваш друг нарисует что-то — не спешите с суждениями. Уверяю вас, в рисунке можно столько всего увидеть!

Спасибо, что прочитали! Надеюсь, статья показалась вам интересной, и буду рад отзывам и комментариям.


В статье я говорил о животных, т. е. об органических формах. С девайсами и средствами передвижения все обстоит совершенно по-другому. Хотите узнать, о чем будет следующая статья? Вот вам подсказка:

Подписывайтесь на меня в twitter, чтобы узнавать о новых статьях.

Об авторе:
Эндрю начал работать в Icons8 в качестве специалиста по юзабилити; он проводил интервью и юзабилити-исследования. Он очень хотел поделиться своими находками с профессиональным сообществом, поэтому начал писать интересные и забавные (иногда одновременно) статьи в наш блог.


Источник: blog.aic.ru

Комментарии: