Дональд Хоффман, Ричард Закия: законы зрения и восприятия.

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Помощь проекту

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


Текст: Donald D. Hoffman «Visual Intelligence», Richard D. Zakia «Perceprion and Imaging».

Нейропсихолог Дэвид Марр (1946-1981) сравнивает создание визуальных конструкций с обработкой информации в компьютере: «Зрение превращает образы внешнего мира в их полезные описания, свободные от ненужной информации».

  • Все что мы видим конструируется мозгом так же, как «видимое» компьютером с камерой конструируется программной средой.
Куб Луиса Альберта Некера.

Какая из вершин куба Некера находится спереди, когда мы на него не смотрим?

  • Никакая.

Где находится этот куб, когда мы его не видим?

  • Нигде.

Зрение это активный процесс и его склонность к созданию конструкций служит ключом к успеху великих произведений искусства. С одной стороны картина — это просто следы краски на холсте. Но зритель видит больше: ландшафт с горами и синими реками, натюрморт с зеленым виноградом и черной мухой, женщину с длинными каштановыми волосами и непостижимой улыбкой.

Гений художника располагает краски так, чтобы гений зрителя мог их интерпретировать, или, как у кубистов, встречал противоречия в каждой интерпретации.

ФУНДАМЕНТАЛЬНАЯ ПРОБЛЕМА ЗРЕНИЯ. Видимый образ можно интерпретировать бесконечным числом способов.

ФУНДАМЕНТАЛЬНАЯ ПРОБЛЕМА ГЛУБИНЫ. Видимый образ разворачивается в двух измерениях. Интерпретировать его в трех измерениях можно бесконечным числом способов.

  • Вся видимая глубина конструируется нами самими.

ФУНДАМЕНТАЛЬНАЯ РОЛЬ ЗРИТЕЛЬНЫХ ПРАВИЛ. Мы создаем визуальные миры из двусмысленных образов в согласии со зрительными правилами.

  • Никто не учил нас этим правилам, мы приобретаем их под действием визуальной среды, подобно приобретению языковых навыков. Взрослый человек может понять бесчисленное множество фраз, пользуясь правилами грамматики. Правила зрения позволяют понять бесчисленное множество изображений.

ПРАВИЛО УСТОЙЧИВОСТИ. Конструируются только те визуальные миры, которые сохраняют стабильность при смене вида.

Угловое соединение двух линий в пространстве — устойчивая фигура.
Случайное пересечение двух отдельных линий — неустойчивая фигура, видимая как угол только со специальной точки зрения.
  • Отрезок на плоскости можно интерпретировать множеством способов. Это может быть плоский круг, увиденный со стороны, или полукруг, или кривая, и так далее. Правило устойчивости исключает все эти варианты. Единственной разрешенной интерпретацией становится прямой отрезок. Только со специальной точки зрения кривая будет выглядеть как отрезок прямой. Зато, практически с любой точки зрения, прямые отрезки выглядят как прямые.

ПРАВИЛО 1. Прямая линия на изображении конструируется как прямая линия в 3D.

Это может быть любая плоская фигура в 3D, но мы видим прямую линию в пространстве.

ПРАВИЛО 2. Если концы линий совпадают на изображении, они конструируются совпадающими в 3D.

Слева мы конструируем объемный многогранник, справа плоский многоугольник.

ПРАВИЛО 3. Коллинеарные линии изображения конструируются коллинеарными в 3D.

  • В противном случае их коллинеарность вызвана случайным совпадением, специальной точкой зрения, нарушающей правило устойчивости.

ПРАВИЛО 4. Близлежащие элементы фигуры конструируются близкими в 3D.

Круги конструируются расположенными в разных плоскостях.

ПРАВИЛО 5. Плавная кривая на изображении конструируется плавной в 3D.

Фигура конструируется как кольцо в 3D. Мы знаем как выглядит ее поверхность не только вдоль контуров, но и между ними.

ПРАВИЛО 6. Если допустимо, кривая линия на изображении конструируется как край поверхности в 3D.

ПРАВИЛО 7. Если допустимо, Т-образное соединение линий на изображении конструируется как край поверхности, перекрывающий другой ее край в 3D.

Видимая и предполагаемая часть Т-образного соединения.

ПРАВИЛО 8. Выпуклая линия фигуры на изображении конструируется как выпуклая область в 3D.

Три типа изгиба поверхности: выпуклый, вогнутый, седлообразный.

ПРАВИЛО 9. Вогнутая линия фигуры на изображении конструируется как седлообразная область в 3D.

  • Вогнутые области в 3D как правило не видны, поэтому не интерпретируются из вогнутых линий.

ПРАВИЛО 10. Поверхности в 3D конструируются максимально гладкими.

Линия седлообразного изгиба (пунктир) конструируется плавной.

Мы создаем субъективные [невидимые, возникающие из экстраполированного негативного пространства] фигуры только если это превращает окружающие несимметричные формы в симметричные, но частично скрытые.

Справа субъективный белый квадрат не создается т.к. образующие его кресты симметричны.

ПРАВИЛО 11. Субъективные фигуры создаются только при наличии вогнутых областей внутри перекрываемых фигур.

Примеры вогнутых углов на скрытых фигурах.
  • Субъективные фигуры создаются только неслучайными совпадениями — такими, при которых мы не расцениваем образующие их границы самостоятельными и полностью показанными фигурами.
При одинаковых углах субъективный квадрат слева не создается т.к. L-образные формы границ кажутся самостоятельными фигурами, а не частично скрытыми, как справа.

ПРАВИЛО 12. Подобные визуальные структуры группируются и ссылаются на общий источник.

Мы конструируем черные линии на белом фоне слева и белые на черном справа благодаря их подобию.

ПРАВИЛО 13. Точка пересечения как минимум трех линий на изображении интерпретируется их общей точкой в 3D.

Первые две фигуры образуют субъективный квадрат, перекрывающий линии сверху (Т-образное соединение), третья фигура (сумма двух первых) квадрата не образует, т.к. границы квадрата должны точно совпадать с угловыми точками перекрываемых линий, что нарушает правило устойчивости.

Изображение на сетчатке нашего глаза дискретно. Подобно картинам пуантилиста Жоржа Сера оно состоит лишь из точек. Все кривые и поверхности на картине создаются нами самостоятельно.

Слева: линия в поле зрения, справа: ее восприятие сетчаткой.

Все, что мы видим, создается нашим мозгом. Люди видят вещи одинаковыми потому, что пользуются одинаковыми визуальными правилами.

То, что мы сами конструируем видимые вещи не значит, что эти конструкции повинуются нашим желаниям.

Визуальные конструкции создаются по правилам. Шахматные правила позволяют сыграть бесконечное множество партий, но они строго ограничивают движения фигур.

ПРАВИЛО 14. Формы разделяются на части по вогнутым углам.

Линия разделения объекта находится внутри вогнутого угла.

ПРАВИЛО 15. Формы разделяются на части по максимально искривленным вогнутым участкам.

Форма разделяется на три части по самым вогнутым участкам.
  • Переворачивание фигуры меняет строение формы т.к. меняется интерпретация выпуклых и вогнутых участков: мы предпочитаем видеть предметы под собой, а не над собой.
Перевернутая форма разделяется иначе.

ПРАВИЛО 16. Силуэты разделяются на части по вогнутым углам и максимально искривленным вогнутым участкам.

Правая половина круга разделяется на большее число частей.
  • Части предметов, полученные разделением по вогнутым участкам, как правило имеют собственные названия. Назвать регионы, созданные другим разделением, бывает непросто. Способ визуального разделения мира соответствует способу вербального разделения. Симметрию заметить проще, чем повторение контура, потому что симметрия отчетливо разделяет фигуру на части.
Части вазы и профиля, полученные делением фигур по вогнутым участкам, имеют собственные названия.

ПРАВИЛО 17. Выразительность линий, образующих угол, увеличивается с остротой этого угла.

ПРАВИЛО 18. Выразительность линий, образующих изгиб, увеличивается с кривизной этого изгиба.

  • Интерпретируя кривую, мы должны определить, служит ли она контуром какому-то объекту. Если так, то нужно определить, с какой стороны от контура расположен объект. Но как мы определим это, не зная, что это за объект? Мы отделяем фигуру от фона независимо от знакомства с объектом.

ПРАВИЛО 19. Фигура отделяется от фона так, что части фигуры обладают более выразительными контурами, чем негативное пространство.

В фигуре слева проще увидеть кубок, в фигуре справа — профили.

ПРАВИЛО 20. Фигура отделяется от фона так, что фигура обладает более выразительными частями.

  • Мы предпочитаем кратчайшие линии разреза фигуры. Визуальный мир не поступает к нам расфасованным на объекты и их части. Мы сами создаем визуальный мир и разделяем его. Можно разделить объект на части множеством способов, но большинство из них будут бесполезны.
Из точек наибольшего изгиба можно провести разные разрезы, кратчайшие указаны на правом изображении.

ПРАВИЛО 21. Постепенная смена цветового оттенка, цветовой насыщенности и яркости на изображении интерпретируется как изменение освещения.

ПРАВИЛО 22. Резкая смена цветового оттенка, цветовой насыщенности и яркости на изображении интерпретируется как изменение свойств поверхности.

Изображение справа интерпретируется как освещенное разноцветными источниками, слева — как состоящее из разных элементов.

ПРАВИЛО 23. Конструируется минимально возможное число источников света.

ПРАВИЛО 24. Источники света помещаются над головой.

Изображение интерпретируется как трехмерный объект освещенный единственным источником, расположенным сверху. В связи с этим пять окружностей конструируются выпуклыми и одна вогнутой.

ПРАВИЛО 25. Полупрозрачные фильтры не инвертируют яркость.

ПРАВИЛО 26. Полупрозрачные фильтры уменьшают различия яркостей.

Фигура AB с наложенным полупрозрачным фильтром, образует участки C и D.

ПРАВИЛО 27. Комбинация фигуры, ее цвета и световых источников подбирается наиболее стабильным образом (не зависящим от случайных факторов).

На изображении справа конструируется полупрозрачный фильтр, субъективно усиливающий яркость правого ромба с точкой — цвет фигуры интерпретируется как «белый в тени».

ПРАВИЛО 28. Наиболее освещенные участки визуального поля интерпретируются как белые или светящиеся.

  • Мы не всегда задаем точку черного, но почти всегда задаем точку белого.
В сетчатке находится два типа фоторецепторов: палочки, отвечающие за сумеречное зрение, и колбочки трех типов, чувствительных к разным длинам световой волны — S, M и L.
Простая модель создания цветов и яркости в сетчатке.

ПРАВИЛО 29. Движение создается по кратчайшей возможной траектории.

При перемещении фигуры О в точку Х ее движение конструируется проходящим по кратчайшей прямой между этими точками.

ПРАВИЛО 30. При движении создается наименьшее число новых объектов и сохраняется наибольшее число старых.

При перемещении фигур О О в точки Х Х происходящее конструируется как движение уже существующих фигур, а не исчезновение старой слева и возникновение новой справа.

ПРАВИЛО 31. Траектория движения стремится повторить себя на всем доступном пространстве.

Интерпретация движения фигур любой группы как сверху-вниз или слева-направо повторяет этот паттерн движения на все поле аналогичных фигур.

ПРАВИЛО 32. Поле скоростей (векторов движения отдельных точек фигуры) создается самым плавным из возможных образов.

Движение отдельных точек фигуры конструируется по наиболее плавному полю векторов.

ПРАВИЛО 33. Если допустимо, то движение конструируется как проекция жесткого движения тела в 3D.

  • При таком движении расстояния между точками тела остаются постоянными, например, как при вращении фигуры.

ПРАВИЛО 34. Если допустимо, то движение конструируется как проекция трехмерного жесткого и плоского движения.

Отдельные участки фигуры должны двигаться жестко и плоско, чтобы интерпретироваться как движения человека.

ПРАВИЛО 35: Источники света движутся медленно.

Перемещение фигуры из точки 1 в точку 2 интерпретируется как движение вправо и вверх, а не по диагонали доски, т.к. предполагается, что источник света, создающий тень, остается неподвижным или движется медленнее, чем фигура.
  • Существует два анатомически разделенных пути визуальной обработки информации: крупноклеточный (магноцеллюлярный) для обработки движения, освещения, глубины и грубых форм; мелкоклеточный (парвоцеллюлярный) для обработки цвета и точных форм.

Фигура и фон = позитивное и негативное пространство = сигнал и шум.

В зависимости от выбора фигуры и фона мы будем видеть либо стрелки, либо букву М.

Некоторые свойства фигуры и фона:

  1. Фигура не существует без фона.
  2. Несмотря на то, что фигура и фон находятся в одной физической плоскости, фигура часто кажется расположенной ближе к наблюдателю.
  3. Фигура и фон не могут быть увидены одновременно — только поочередно.
  4. Фигура обычно занимает меньшую площадь, чем фон.
  5. Кажется, что фигура имеет контур и форму, а фон — нет.
  6. Определение фигуры на фоне это избирательный процесс, зависящий от обстоятельств и цели поиска.
Разные варианты отделения фигуры от фона для человека, опаздывающего на встречу (часы), ищущего театр (вывеска) или такси (автомобиль).

Увеличение различий между фигурой и фоном усиливает ясность восприятия.

Гармоничное сочетание света и тени в японском языке обозначается словом «нотан». Критерии возникновения нотана в черно-белом изображении такие:

  1. Негативное пространство достаточно закрыто, чтобы иметь потенциальную форму.
  2. Фигура и фон не доминируют друг над другом. Они визуально сбалансированы и позволяют зрителю инвертировать свое восприятие.
Примеры нотан-фигур: символ инь-ян, гемоетрические гравюры Маурица Эшера.

Гештальт — нечто целое, отличное от суммы его частей.

Некоторые правила образования гештальта:

  1. Близость. Чем ближе расположены элементы, тем вероятнее они сгруппируются в фигуру.
  2. Размер. Чем меньше ограниченная область, тем больше вероятность, что она будет восприниматься как отдельная фигура.
  3. Сходство. Элементы имеющие визуальное сходство (в форме, размере, цвете, движении и т.д.) будут восприниматься как связанные.
  4. Симметрия. Чем более симметрична фигура, тем вероятнее она отделится от фона.
  5. Непрерывность. Визуальные элементы, имеющие наименьшие разрывы, группируются в общие ряды.
Edward Weston - 1929 - Eroded Rock #51

Эффект Зейгарник. В 1927 году русский психолог Блюма Зейгарник провела серию экспериментов в которой показала, что задачи, которые были прерваны перед выполнением, чаще запоминаются, чем аналогичные непрерванные задачи.

Ролло Мэй: «Мне кажется, что многие авторы вдохновляются скорее теми писателями, которых они понимают лишь частично, чем теми, которых они понимают полностью».

Большая часть того, что мы видим, зависит от нашего прошлого опыта (памяти), от нашей личности, от того, что мы ищем. Вот почему одна и та же картинка часто получает разные оценки от зрителей. Зрительный опыт зависит от внутренних и внешних факторов — на что мы смотрим и что мы ищем.

То, что человек видит и ощущает называется перцептом (продуктом процесса восприятия). То, что человек сообщает об увиденном, это вербальная попытка описать перцепт. Такие попытки часто оказываются неудачными — речь отличается от зрения.

С помощью речи человек пытается рассказать о своих перцептах окружающим.
Артур Кёстлер: «Язык может стать экраном между мыслителем и реальностью. Это причина, по которой настоящая креативность часто начинается там, где заканчивается язык».

Перцепт это результат взаимодействия между физическим стимулом и уникальной психологической структурой человека. Двух одинаковых людей не существует. Одна и та же чашка кофе будет ощущаться по разному утром и вечером. Вкус хот-догов на футбольном матче отличаются от их вкуса дома.

Закон прегнантности: мы хотим организовать наш мир, чтобы справиться с ним. Мы ищем стабильности, осмысленности, баланса, защищенности и т.д. Если вокруг слишком много информации, мы стремимся сгруппировать и сократить ее, отфильтровать лишнее. Мы хотим сократить напряжение и стресс, чтобы обрести стабильность и равновесие.

Изображение служит триггером, запускающим работу долгосрочной памяти.

Известная проблема художественных школ: как научить студентов рисовать то, что они видят, а не то, что они знают?

Зритель смотрит на фотографию, фотография вызывает эквивалент чего-то похожего в памяти, этот эквивалент воздействует на зрителя.
Кларенс Джон Лафлин: «Физический объект это просто ступенька ко внутреннему миру».

Фотографии — это высказывания, которые могут быть прочитаны. Но, как и все высказывания, они должны быть прочитаны в контексте — в контексте других фотографий или описания, в историческом контексте. Все фотографии в какой-то степени историчны.

Томас Манн: «Поведение человека обретает смысл когда мы думаем о нем в терминах его целей, нужд и мотивов».

Отношения между автором и изображаемым объектом:

  • Проекция — автор проецирует свои текущие чувства на объект. Если он видит дерево, стоящее гордо и одиноко, то он будет стараться изобразить именно это чувство (Ван Гог).
  • Интроекция — попытка прислушаться к объекту, изучить его, раскрыть изнутри (Генри Торо).
  • Слияние — автор медитативно сливается с объектом, устанавливает с ним близкие отношения (Поль Клее).

Семиотика Чарлза Пирса выделяет три пути репрезентации объекта:

  • Иконический — репрезентация выглядит как объект: фотография автомобиля изображает автомобиль.
  • Индексальный — использует указание, ссылку: фотография изображает тень от автомобиля или следы от шин.
  • Символический — использует принятые культурой соглашения о вещах: фотография изображает логотип автомобиля, слово «автомобиль».
Edward Weston - 1944 - Johnny

Лингвистические термины синтаксиса, семантики и прагматики можно использовать и в визуальном режиме.

  • Синтаксис — визуальная грамматика, дизайн композиции изображения.
  • Семантика — тот смысл, который зритель вкладывает в происходящее на изображении.
  • Прагматика — обращение к контексту, в котором наблюдается изображение.

Изменения синтаксиса или прагматики приводят к семантическим изменениям.

Пабло Пикассо: «Искусство это ложь, которая позволяет нам понять правду».

Источник: m.vk.com

Комментарии: