Разница между «вспомнить» и «увидеть» гораздо меньше, чем кажется |
||
|
МЕНЮ Главная страница Поиск Регистрация на сайте Помощь проекту Архив новостей ТЕМЫ Новости ИИ Голосовой помощник Разработка ИИГородские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Искусственный интеллект Слежка за людьми Угроза ИИ Атаки на ИИ Внедрение ИИИИ теория Компьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Психология ИИ Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Промпты. Генеративные запросы Распознавание лиц Распознавание образов Распознавание речи Творчество ИИ Техническое зрение Чат-боты Авторизация |
2026-07-01 16:15 Есть простой опыт, который можно проделать прямо сейчас. Закройте глаза и попробуйте вспомнить лицо человека, с которым только что разговаривали. Получилось? А теперь откройте глаза и посмотрите на любой предмет перед собой. Кажется, что это два разных процесса: один - воображение, второй - честное, прямое восприятие реальности, как она есть. Свет попал в глаз, сигнал пошёл в мозг, мозг показал картинку. Так вот. Последние тридцать лет нейронауки занимаются тем, что аккуратно разбирают эту иллюзию на части. И выясняется неприятная вещь: разница между «вспомнить» и «увидеть» гораздо меньше, чем кажется. В обоих случаях мозг в основном работает с собственными внутренними моделями. Глаз поставляет на удивление мало информации - а остальное мозг достраивает сам, причём заранее, до того, как сигнал вообще пришёл. Это и есть теория предсказательного кодирования. Одна из самых влиятельных идей в современной науке о мозге, и при этом одна из самых контринтуитивных. Начать придётся издалека, потому что у этой теории на удивление длинная борода. Ещё в 1860 году немецкий физик и физиолог Герман фон Гельмгольц предложил понятие «бессознательного умозаключения». Гельмгольц занимался зрением и заметил странную вещь: глаз постоянно даёт мозгу неоднозначные, смазанные, противоречивые сигналы, но мы почему-то видим чёткий и стабильный мир. Его вывод был дерзким для своего времени - мозг не пассивно принимает картинку, а активно её домысливает, выстраивает наиболее вероятную гипотезу о том, что там, снаружи, могло вызвать такой набор сигналов на сетчатке. Гипотеза стояла в стороне почти полтора века, пока не превратилась в строгую вычислительную модель. Произошло это в 1999 году, когда нейроучёные Раджеш Рао и Дана Баллард опубликовали работу, объяснявшую загадочное поведение нейронов зрительной коры. Дело в том, что отдельные клетки в первичной зрительной коре реагировали не только на то, что попадало строго в их «зону ответственности» - крошечный кусочек поля зрения, - но почему-то учитывали и контекст, происходящий вокруг этой зоны. Стандартные модели зрения такого предсказать не могли. А модель Рао и Балларда могла, и довольно изящно: если представить, что более высокие уровни коры посылают вниз предсказания о том, что должно появиться в нижних слоях, а нижние уровни в ответ посылают вверх только разницу между предсказанием и реальностью - несостыковку, ошибку, - то контекстная чувствительность нейронов перестаёт быть загадкой и становится прямым следствием архитектуры. С этого момента идея пошла в рост. В 2000-х британский нейроучёный Карл Фристон обернул её в строгий математический аппарат и назвал принципом свободной энергии - по сути, формальное описание того, как любая самоподдерживающаяся система, от клетки до мозга, минимизирует расхождение между своими ожиданиями и поступающими данными. Философ Энди Кларк сделал теорию понятной широкой публике в своей книге «Surfing Uncertainty». А нейроучёный Анил Сет придумал формулировку, которая разошлась по интернету и стала почти девизом всего направления: восприятие - это «контролируемая галлюцинация». Представьте себе не одну систему, а вертикальную лестницу, где на каждой ступеньке сидит участок мозга. Верхние ступеньки - это абстрактные, общие модели мира: «я нахожусь дома», «сейчас вечер», «передо мной, скорее всего, чашка кофе». Нижние ступеньки - это конкретные сенсорные детали: контуры, цвета, текстуры, звуки. Главный фокус в том, что сигнал по этой лестнице бежит в обе стороны одновременно. Сверху вниз идут предсказания - каждый уровень говорит нижнему: вот что я ожидаю от тебя увидеть. Снизу вверх идёт не сырая картинка мира, а только ошибка предсказания - разница между тем, что было предсказано, и тем, что реально поступило с сетчатки или из уха. Если предсказание точное, наверх почти ничего не идёт, потому что докладывать особо не о чем. Если предсказание промахнулось, наверх летит мощный сигнал ошибки, который заставляет верхние уровни пересмотреть модель. То есть в норме мозг большую часть времени разговаривает сам с собой. Внешний мир в этой картине - не источник информации в привычном смысле, а постоянный корректор, тонкий ремень безопасности, который время от времени дёргает за рукав и говорит: ты не угадал, поправь модель. Мы привыкли думать снизу вверх: глаз получает свет, отправляет данные в мозг, мозг их складывает в картинку, как пазл. Предсказательное кодирование говорит ровно обратное. Картинка уже готова заранее, в виде ожидания. Свет с сетчатки нужен лишь затем, чтобы подтвердить эту картинку или внести в неё минимальную поправку. Хорошо, а откуда мы вообще знаем, что это правда? У теории действительно накопился солидный набор экспериментальных подтверждений, и разбросаны они по очень разным областям. Уже упомянутые особенности нейронов зрительной коры - реакция, зависящая от контекста за пределами «своей» зоны, - объясняются предсказательным кодированием напрямую, без подгонки задним числом. Дальше - эффект, который любой может проверить на себе. Если показать человеку один и тот же стимул несколько раз подряд, реакция мозга на него постепенно слабеет. Называется это repetition suppression, подавление повторения. С точки зрения старой модели «просто обработай входящий сигнал» это странно - сигнал-то одинаковый каждый раз. А с точки зрения предсказательного кодирования всё логично: мозг быстро научился предсказывать этот стимул, ошибка предсказания падает почти до нуля, значит и сигнал, который нужно прогонять наверх, падает тоже. Ещё пример - бистабильное восприятие, когда одна и та же неоднозначная картинка вдруг переключается с одной интерпретации на другую, как знаменитый кубик Неккера или ваза-два-лица. Мозг здесь буквально борется между двумя конкурирующими предсказаниями, и победитель в какой-то момент меняется - мы это переживаем как внезапный щелчок восприятия. И, пожалуй, самая показательная демонстрация - иллюзия вогнутого лица. Если взять обычную маску лица и развернуть её обратной, вогнутой стороной к зрителю, мозг почти всегда отказывается видеть вогнутость. Он упрямо достраивает выпуклое лицо, потому что у него есть мощнейшее, отшлифованное за всю жизнь предсказание: лица выпуклые. Реальный сенсорный сигнал говорит одно, а внутренняя модель настолько сильна, что попросту переписывает его под себя. Вот она, контролируемая галлюцинация, в чистом виде - и заметьте, никакого расстройства восприятия тут не требуется, это норма для абсолютно здорового мозга. Самое интересное начинается, когда теорию выводят за пределы зрения. В 2013 году Анил Сет предложил распространить ту же логику на интероцепцию - восприятие сигналов изнутри собственного тела: сердцебиение, дыхание, голод, общее самочувствие. Идея в том, что эмоции - это тоже своего рода предсказания, причём предсказания о причинах внутренних телесных сигналов. Учащённое сердцебиение мозг может интерпретировать как тревогу перед выступлением, а может - как обычное возбуждение от хорошей новости, и выбор интерпретации сильно зависит от контекста и от того, что мозг ожидал почувствовать. Это смыкается с работами психолога Лизы Фелдман Барретт о сконструированных эмоциях и открывает довольно практичную перспективу: если эмоция отчасти строится мозгом по принципу предсказания, а не просто считывается напрямую с тела, значит, у этого процесса есть пространство для перенастройки. Не магическое «просто думай позитивно», а вполне предметная работа с тем, какие предсказания мозг привык делать про собственное состояние. Дальше - психиатрия. Сегодня предсказательное кодирование активно используют, чтобы переосмыслить природу психоза и некоторых тревожных расстройств. Грубо говоря, если баланс между предсказанием сверху и ошибкой снизу нарушен - например, мозг начинает придавать аномально высокий вес собственным предсказаниям и аномально низкий вес реальным сенсорным данным, - человек начинает видеть и слышать то, чего нет, потому что внутренняя модель попросту перестаёт получать достаточно сильные поправки извне. Здесь стоит сделать честную оговорку: это активно исследуемая, развивающаяся область, и было бы преждевременно сказать, что загадка психоза решена. Но рамка предсказательного кодирования дала психиатрии новый, более точный язык для разговора о том, что вообще происходит в такие моменты. Спросите, какая от всего этого практическая польза, если вы не нейроучёный. Польза есть, и она довольно отрезвляющая. Первое - стоит относиться к собственному восприятию с лёгким подозрением, не в смысле паранойи, а в смысле трезвости. То, что вы видите и чувствуете прямо сейчас, в огромной степени собрано из ваших прошлых ожиданий, а не из чистых данных момента. Это касается и того, как вы воспринимаете людей - первое впечатление работает как мощное предсказание, которое потом фильтрует все последующие сигналы. Второе - это объясняет, почему так трудно менять привычки, убеждения, паттерны отношений. Мозг экономит силы, опираясь на старые предсказания, и сопротивляется поправкам, потому что поправка стоит энергии. Чтобы реально изменить модель, нужен не один разовый довод, а систематический, повторяющийся опыт, который раз за разом не совпадает со старым предсказанием - только тогда ошибка накапливается достаточно, чтобы модель сдалась и перестроилась. Третье, и тут я уже выхожу за пределы строгой науки в сторону личного наблюдения: вся эта конструкция неплохо объясняет, почему рассказанная история меняет восприятие реальности сильнее, чем голый факт. История задаёт мощное предсказание о том, что должно произойти дальше, и мозг слушателя начинает достраивать происходящее вокруг этого предсказания. Хороший рассказчик в каком-то смысле управляет не фактами, а чужими прогнозами. И последнее. Открытие предсказательного кодирования не отменяет внешний мир - он по-прежнему есть, и ошибка предсказания по-прежнему держит нас на привязи к реальности, не давая улететь в чистые фантазии. Но оно меняет саму идею о том, что значит видеть. Видеть - не значит просто получать. Видеть - значит постоянно, тысячи раз в секунду, заключать пари с реальностью и проверять, угадал ли мозг. Большую часть времени он угадывает. И именно поэтому мир вокруг кажется таким устойчивым, очевидным, не требующим доказательств. А он, оказывается, требует. Просто мозг настолько хорош в этой игре, что мы перестали замечать саму игру. Телеграм: t.me/ainewsline Источник: vk.com Комментарии: |
|