Дональд Хоффман, Ричард Закия: законы зрения и восприятия. |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-03-13 17:07 Текст: Donald D. Hoffman «Visual Intelligence», Richard D. Zakia «Perceprion and Imaging». Нейропсихолог Дэвид Марр (1946-1981) сравнивает создание визуальных конструкций с обработкой информации в компьютере: «Зрение превращает образы внешнего мира в их полезные описания, свободные от ненужной информации».
Какая из вершин куба Некера находится спереди, когда мы на него не смотрим?
Где находится этот куб, когда мы его не видим?
Зрение это активный процесс и его склонность к созданию конструкций служит ключом к успеху великих произведений искусства. С одной стороны картина — это просто следы краски на холсте. Но зритель видит больше: ландшафт с горами и синими реками, натюрморт с зеленым виноградом и черной мухой, женщину с длинными каштановыми волосами и непостижимой улыбкой. Гений художника располагает краски так, чтобы гений зрителя мог их интерпретировать, или, как у кубистов, встречал противоречия в каждой интерпретации. ФУНДАМЕНТАЛЬНАЯ ПРОБЛЕМА ЗРЕНИЯ. Видимый образ можно интерпретировать бесконечным числом способов. ФУНДАМЕНТАЛЬНАЯ ПРОБЛЕМА ГЛУБИНЫ. Видимый образ разворачивается в двух измерениях. Интерпретировать его в трех измерениях можно бесконечным числом способов.
ФУНДАМЕНТАЛЬНАЯ РОЛЬ ЗРИТЕЛЬНЫХ ПРАВИЛ. Мы создаем визуальные миры из двусмысленных образов в согласии со зрительными правилами.
ПРАВИЛО УСТОЙЧИВОСТИ. Конструируются только те визуальные миры, которые сохраняют стабильность при смене вида.
ПРАВИЛО 1. Прямая линия на изображении конструируется как прямая линия в 3D. ПРАВИЛО 2. Если концы линий совпадают на изображении, они конструируются совпадающими в 3D. ПРАВИЛО 3. Коллинеарные линии изображения конструируются коллинеарными в 3D.
ПРАВИЛО 4. Близлежащие элементы фигуры конструируются близкими в 3D. ПРАВИЛО 5. Плавная кривая на изображении конструируется плавной в 3D. ПРАВИЛО 6. Если допустимо, кривая линия на изображении конструируется как край поверхности в 3D. ПРАВИЛО 7. Если допустимо, Т-образное соединение линий на изображении конструируется как край поверхности, перекрывающий другой ее край в 3D. ПРАВИЛО 8. Выпуклая линия фигуры на изображении конструируется как выпуклая область в 3D. ПРАВИЛО 9. Вогнутая линия фигуры на изображении конструируется как седлообразная область в 3D.
ПРАВИЛО 10. Поверхности в 3D конструируются максимально гладкими. Мы создаем субъективные [невидимые, возникающие из экстраполированного негативного пространства] фигуры только если это превращает окружающие несимметричные формы в симметричные, но частично скрытые. ПРАВИЛО 11. Субъективные фигуры создаются только при наличии вогнутых областей внутри перекрываемых фигур.
ПРАВИЛО 12. Подобные визуальные структуры группируются и ссылаются на общий источник. ПРАВИЛО 13. Точка пересечения как минимум трех линий на изображении интерпретируется их общей точкой в 3D. Изображение на сетчатке нашего глаза дискретно. Подобно картинам пуантилиста Жоржа Сера оно состоит лишь из точек. Все кривые и поверхности на картине создаются нами самостоятельно. Все, что мы видим, создается нашим мозгом. Люди видят вещи одинаковыми потому, что пользуются одинаковыми визуальными правилами. То, что мы сами конструируем видимые вещи не значит, что эти конструкции повинуются нашим желаниям. Визуальные конструкции создаются по правилам. Шахматные правила позволяют сыграть бесконечное множество партий, но они строго ограничивают движения фигур. ПРАВИЛО 14. Формы разделяются на части по вогнутым углам. ПРАВИЛО 15. Формы разделяются на части по максимально искривленным вогнутым участкам.
ПРАВИЛО 16. Силуэты разделяются на части по вогнутым углам и максимально искривленным вогнутым участкам.
ПРАВИЛО 17. Выразительность линий, образующих угол, увеличивается с остротой этого угла. ПРАВИЛО 18. Выразительность линий, образующих изгиб, увеличивается с кривизной этого изгиба.
ПРАВИЛО 19. Фигура отделяется от фона так, что части фигуры обладают более выразительными контурами, чем негативное пространство. ПРАВИЛО 20. Фигура отделяется от фона так, что фигура обладает более выразительными частями.
ПРАВИЛО 21. Постепенная смена цветового оттенка, цветовой насыщенности и яркости на изображении интерпретируется как изменение освещения. ПРАВИЛО 22. Резкая смена цветового оттенка, цветовой насыщенности и яркости на изображении интерпретируется как изменение свойств поверхности. ПРАВИЛО 23. Конструируется минимально возможное число источников света. ПРАВИЛО 24. Источники света помещаются над головой. ПРАВИЛО 25. Полупрозрачные фильтры не инвертируют яркость. ПРАВИЛО 26. Полупрозрачные фильтры уменьшают различия яркостей. ПРАВИЛО 27. Комбинация фигуры, ее цвета и световых источников подбирается наиболее стабильным образом (не зависящим от случайных факторов). ПРАВИЛО 28. Наиболее освещенные участки визуального поля интерпретируются как белые или светящиеся.
ПРАВИЛО 29. Движение создается по кратчайшей возможной траектории. ПРАВИЛО 30. При движении создается наименьшее число новых объектов и сохраняется наибольшее число старых. ПРАВИЛО 31. Траектория движения стремится повторить себя на всем доступном пространстве. ПРАВИЛО 32. Поле скоростей (векторов движения отдельных точек фигуры) создается самым плавным из возможных образов. ПРАВИЛО 33. Если допустимо, то движение конструируется как проекция жесткого движения тела в 3D.
ПРАВИЛО 34. Если допустимо, то движение конструируется как проекция трехмерного жесткого и плоского движения. ПРАВИЛО 35: Источники света движутся медленно.
Фигура и фон = позитивное и негативное пространство = сигнал и шум. Некоторые свойства фигуры и фона:
Увеличение различий между фигурой и фоном усиливает ясность восприятия. Гармоничное сочетание света и тени в японском языке обозначается словом «нотан». Критерии возникновения нотана в черно-белом изображении такие:
Гештальт — нечто целое, отличное от суммы его частей. Некоторые правила образования гештальта:
Эффект Зейгарник. В 1927 году русский психолог Блюма Зейгарник провела серию экспериментов в которой показала, что задачи, которые были прерваны перед выполнением, чаще запоминаются, чем аналогичные непрерванные задачи. Ролло Мэй: «Мне кажется, что многие авторы вдохновляются скорее теми писателями, которых они понимают лишь частично, чем теми, которых они понимают полностью». Большая часть того, что мы видим, зависит от нашего прошлого опыта (памяти), от нашей личности, от того, что мы ищем. Вот почему одна и та же картинка часто получает разные оценки от зрителей. Зрительный опыт зависит от внутренних и внешних факторов — на что мы смотрим и что мы ищем. То, что человек видит и ощущает называется перцептом (продуктом процесса восприятия). То, что человек сообщает об увиденном, это вербальная попытка описать перцепт. Такие попытки часто оказываются неудачными — речь отличается от зрения. Артур Кёстлер: «Язык может стать экраном между мыслителем и реальностью. Это причина, по которой настоящая креативность часто начинается там, где заканчивается язык». Перцепт это результат взаимодействия между физическим стимулом и уникальной психологической структурой человека. Двух одинаковых людей не существует. Одна и та же чашка кофе будет ощущаться по разному утром и вечером. Вкус хот-догов на футбольном матче отличаются от их вкуса дома. Закон прегнантности: мы хотим организовать наш мир, чтобы справиться с ним. Мы ищем стабильности, осмысленности, баланса, защищенности и т.д. Если вокруг слишком много информации, мы стремимся сгруппировать и сократить ее, отфильтровать лишнее. Мы хотим сократить напряжение и стресс, чтобы обрести стабильность и равновесие. Изображение служит триггером, запускающим работу долгосрочной памяти. Известная проблема художественных школ: как научить студентов рисовать то, что они видят, а не то, что они знают? Кларенс Джон Лафлин: «Физический объект это просто ступенька ко внутреннему миру». Фотографии — это высказывания, которые могут быть прочитаны. Но, как и все высказывания, они должны быть прочитаны в контексте — в контексте других фотографий или описания, в историческом контексте. Все фотографии в какой-то степени историчны. Томас Манн: «Поведение человека обретает смысл когда мы думаем о нем в терминах его целей, нужд и мотивов». Отношения между автором и изображаемым объектом:
Семиотика Чарлза Пирса выделяет три пути репрезентации объекта:
Лингвистические термины синтаксиса, семантики и прагматики можно использовать и в визуальном режиме.
Изменения синтаксиса или прагматики приводят к семантическим изменениям. Пабло Пикассо: «Искусство это ложь, которая позволяет нам понять правду». Источник: m.vk.com Комментарии: |
|