Теория игр: история, философия и психология в Теории игр |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-08-11 15:25 Теория игр - это направление изучения способов, которыми выбор взаимодействующих экономических агентов приводит к предпочтительным результатам или пользе ОТ (или ДЛЯ) этих агентов, причём полученные результаты не могли быть заранее достоверно спланированы ни одной из сторон. 1. Философско-историческая мотивация Теория игр в той форме, в которой она известна экономистам и социологам, получила свою первую общую математическую формулировку в 1944 году - от Джона фон Неймана и Оскара Моргенштерна. По причинам, которые будут обсуждены позже, ограниченность их формальной структуры трактовки, изначально делала теорию применимой только в особых и узко-специфичных условиях. Эта ситуация кардинально изменилась в последующие семь десятилетий, по мере того, как рамки теории были расширены и обобщены. Доработки всё ещё ведутся, и в ближайших публикациях мы рассмотрим несколько нерешённых проблем, лежащих на переднем крае этих разработок. Несмотря на то, что Теория игр начала становиться математически и логически систематизированной только с 1944 года, теоретико-игровые идеи можно найти у исследователей, восходящих к древним временам. Например, в двух текстах Платона, Laches и Symposium, Сократ вспоминает эпизод из битвы при Delium, который некоторые историки интерпретировали (вероятно, анахронично) как связанный со следующей ситуацией. Представьте себе солдата на фронте, который вместе со своими товарищами ждёт отражения атаки врага. Ему может прийти в голову, что если защита будет успешной, то маловероятно, что его личный вклад в победу будет существенным. Но если он останется, то рискует быть убитым или раненым - очевидно, без всякого смысла для него лично (т.к. разгром вражеской армии и так гарантирован). С другой стороны, если противник обладает потенциалом для победы в битве, то шансы вышеупомянутого солдата на смерть или ранение ещё выше, и отсюда ещё более очевидно, что нет смысла воевать, так как линия в любом случае будет разбита. Исходя из этих рассуждений, может показаться, что солдату в любом случае лучше сбежать - независимо от того, кто выиграет битву. Конечно, если все солдаты будут рассуждать таким образом - а все они, по-видимому, с высокой долей вероятности могут рассуждать примерно одинаково, поскольку все они находятся в одинаковом положении, - то это обязательно приведет к исходу, в котором битва будет проиграна. Конечно, этот момент, раз уж он пришел в голову нам, как аналитикам, может приходить в голову и солдатам. Даёт ли это им повод оставаться на своих постах? Напротив: чем больше у солдат страха, что битва будет проиграна, тем больше у них мотивации дезертировать. И чем больше у солдат веры в то, что битва будет выиграна без необходимости участия какого-либо конкретного человека (тебя лично), тем меньше у них причин оставаться и сражаться. Если каждый солдат предполагает, что остальные рассуждают примерно так же, как он, тогда все быстро впадают в панику, и их напуганный командир будет деморализован ещё до того, как враг вступит в бой. Задолго до появления теории игр, которая показала аналитикам, как систематически думать о подобном типе проблем, нечто подобное пришло в голову некоторым выдающимся военачальникам и повлияло на их стратегии. Подобным образом, испанский завоеватель Кортес, высадившись в Мексике с небольшим отрядом, и имея веские причины опасаться нерешительности своих солдат при отражении атак гораздо более многочисленных ацтеков, устранил риск того, что его войска могут подумать об отступлении: он сжёг у берега корабли, на которых они прибыли. Поскольку отступление стало физически невозможным, у испанских солдат не было лучшего варианта действий, чем стоять и сражаться до конца - и, более того, сражаться со всей решимостью, на которую они только были способны. У этих двух ситуаций - в Delium, и у конкистадоров, манипулируемых Кортесом - есть одна общая и любопытная логика. Обратите внимание, что солдаты не мотивированы на отступление только (или даже в основном) из-за их рациональной сравнительной оценки опасностей битвы и своих личных интересов. Скорее, они обнаруживают вескую причину для побега, понимая, что то, что для них имеет смысл делать, зависит от того, что будет иметь смысл и для других, и что все остальные тоже могут рассуждать примерно так же. Ещё один классический источник, предлагающий эту последовательность рассуждений, находится в произведении Шекспира "Генрих Пятый". Во время битвы при Азенкуре Генрих V решил зарезать своих французских пленных на виду у врага, к удивлению своих подчинённых, которые описали затем это действие, как выходящее за пределы допустимых моральных норм. Причины, которые Генрих приводит в качестве стратегических соображений своего поступка: он боялся, что пленные могут освободиться и поставить под угрозу его положение. Однако, теоретик игр мог бы предоставить ему дополнительное стратегическое (и такое же разумное - хотя, возможно, и аморальное) оправдание. Правда, изначально эти примеры могут показаться актуальными только для тех, кто живёт в трудных условиях жёсткой конкуренции. Многие могут подумать, что это важно для генералов, политиков, боссов мафии, спортивных тренеров и прочих альфа-доминантов, чья работа связана со стратегическим манипулированием другими людьми, а вот философ мог бы только пожалеть о своей аморальности, если бы принял для себя подобный концептуальный фундамент. Однако, такой вывод был бы весьма преждевременным. Изучение логики, которая управляет взаимоотношениями между стимулами, стратегическими взаимодействиями и результатами, было фундаментальным в развитии современной политической философии, за много веков до того, как у кого-либо родилось однозначное определение (название) для подобного рода логики. Философы разделяют с социологами убеждение в необходимости иметь возможность представлять и систематически моделировать не только то, что, по их мнению, люди согласно нормативным требованиям должны делать, но и то, что они часто фактически делают в интерактивных ситуациях - нередко, вопреки логике и морали. "Левиафан" Гоббса часто рассматривается как основополагающий труд в современной политической философии - это текст, который положил начало непрерывному анализу и оправданию функций государства, а также его ограничивающей политике в отношении личных свобод. Суть рассуждений Гоббса можно прямо сформулировать следующим образом. Лучшая ситуация для всех людей - это когда каждый волен делать то, что ему заблагорассудится (можно согласиться или не согласиться с этим с точки зрения психологии или идеологии, но речь идёт о постулатах Гоббса). Часто такие свободные люди желают сотрудничать друг с другом для выполнения проектов, которые были бы невозможны для отдельного игрока, т.е. нереальны для исполнения в одиночку. Но если вокруг есть какие-либо моральные или аморальные агенты, они заметят, что их интересы, по крайней мере, иногда могут быть лучше всего удовлетворены, в ситуации взаимовыгодного сотрудничества, а не в изоляции. Предположим, например, что Вы согласны помочь Толяну построить его дом - в обмен на его обещание потом помочь Вам построить Ваш дом. После того, как дом Толяна будет построен, он может обмануть Ваши ожидания, просто нарушив своё обещание. Затем Толян может поразмыслить и осознать, что, если у Вас не будет своего дома, тогда у Вас появятся стимулы и планы по отъёму его дома. Это заставит его постоянно бояться Вас, и вынудит тратить драгоценное время и ресурсы на защиту себя от Ваших (даже чисто гипотетических) притязаний. Лучше всего он может минимизировать эти затраты, нанеся удар первым, и убив Вас при первой же возможности. Конечно, Вы можете предвидеть весь ход его рассуждений, и тогда у Вас появится веская причина, чтобы попытаться убить его раньше. Поскольку Толян мог предвидеть и это рассуждение с Вашей стороны, его первоначальный страх перед Вами уже перестаёт быть параноидальным. Фактически, ни одному из вас даже не обязательно быть аморальным человеком, чтобы запустить эту цепочку взаимных рассуждений; вам нужно только подумать о том, что существует некоторая вероятность развития сценария, при котором другой пойдёт на обман, не выполнив условия сделки. В качестве решения этой проблемы Гоббс предложил тиранию (диктатуру). Люди могут нанять агента - правительство, задача которого наказывать любого, кто нарушит какое-либо взятое на себя обязательство. Пока угроза наказания достаточно ужасна, цена невыполнения обещания будет превышать стоимость его выполнения. Логика здесь идентична той, что используется армией, когда она угрожает расстреливать дезертиров. Если все люди будут знать, что эти стимулы действуют для большинства других, то сотрудничество станет не только возможным, но и ожидаемой нормой, так что война всех против всех переродится во всеобщий мир и сотрудничество. Гоббс доводит логику этого аргумента до очень убедительного вывода, который подразумевает целесообразность существования не только демократичного правительства, наделённого правом и властью принуждать к сотрудничеству, но и всевластия, при котором произвольная воля единственного диктатора может налагать абсолютные обязательства на всех. Немногие современные политические теоретики думают, что конкретные шаги, которыми Гоббс обосновывает свой путь к этому выводу, являются одновременно здравыми и реалистичными. Однако, углублённое рассмотрение этих вопросов здесь увело бы нас от заданной темы - к деталям договорной политической философии. Что важно в данном контексте, так это то, что эти детали, в том формате, в котором они фактически исследуются в современных дебатах, включают в себя сложную интерпретацию проблем с использованием ресурсов современной Теории игр. Более того, основная мысль Гоббса о том, что фундаментальным оправданием принудительной власти и практики правительств является собственная потребность людей защищать себя от того, что теоретики игр называют "социальными дилеммами", принимается, как здравая, множеством (если не большинством) политических теоретиков. Обратите внимание: Гоббс не утверждал, что диктатура сама по себе желательна. Структура его аргумента заключается в том, что логика стратегического взаимодействия оставляет в своей квинтэссенции возможными всего лишь два конечных политических результата: либо тиранию, либо анархию. В результате, разумные участники игры будут склонны выбирать тиранию - как меньшее из двух зол. В рассуждениях солдат Кортеса и политических агентов Гоббса есть общая логика, вытекающая из обстоятельств их положения. В каждом отдельном случае аспект среды, который является наиболее важным для достижения агентами их предпочтительных результатов, представляет собой набор ожиданий и возможных реакций на стратегии их оппонентов. Различие между параметрическим воздействием на пассивный мир и непараметрическим воздействием на мир, который пытается действовать активно в ожидании этих результатов, является фундаментальным. Если Вы хотите пнуть камень вниз с холма, Вам нужно беспокоиться только насчёт массы горной породы и силы своего удара - в какой степени она связана с опорной поверхностью, наклоном земли с другой стороны камня, и ожидаемым воздействием на камень от толчка Вашей ногой. Значения реакции камня на все эти переменные не зависят от Ваших планов и намерений, поскольку камень не имеет собственных интересов в этом деле, и не предпринимает никаких ответных действий, чтобы попытаться помочь / или помешать Вам. Напротив, если Вы захотите столкнуть с холма человека, то в таком случае, если этот человек не без сознания, не связан (или иным образом недееспособен), Вы, скорее всего, не добьетесь лёгкого успеха, если только не сумеете замаскировать свои планы, пока для жертвы не станет слишком поздно уклоняться или упреждать Ваши действия. Кроме того, следует ожидать, что вероятные реакции жертвы могут обернуться для Вас расходами, которые Вам следует заранее принять во внимание. Наконец, относительная вероятность интенсивности ответных действий будет зависеть от ожиданий человека относительно Ваших возможных реакций на его контр-выпады (подумайте, как это повлияет на Ваши рассуждения, если один или оба из вас вооружены, или один из вас больше другого, или один из вас является начальником другого в социуме). Логические проблемы, связанные со вторым типом ситуации (пнуть ногой человека, а не камень) обычно ещё более сложны, что проиллюстрирует простой гипотетический пример. Предположим для начала, что Вы хотите пересечь реку, через которую проведены три моста (допустим, что переплыть, перейти вброд или переправиться на лодке - невозможно). Первый мост, как известно, безопасен и не имеет препятствий; если Вы попытаетесь там перейти, у Вас всё получится гладко. Второй мост находится под обрывом, с которого иногда на путников падают большие камни. Третий мост населен агрессивными кобрами, которые ревниво смотрят на любого прохожего. Теперь предположим, что Вы хотите расположить три моста в порядке их предпочтения, начиная с относительно безопасной точки переправы и заканчивая наиболее опасным. Если Вы не получаете особого специфического удовольствия от риска своей жизнью - концепция, которую, будучи человеком, Вы тоже можете иметь, но мы рассмотрим её в другой раз, - тогда выбор для Вас окажется очевиден. Понятно, что первый мост лучше, так как он самый безопасный. Для ранжирования двух других мостов Вам потребуется информация об их относительных уровнях опасности. Если Вы сможете какое-то время изучать частоту камнепадов и проблески приветливого настроения у кобр, в зависимости от погоды, Вы сможете рассчитать, что вероятность того, что Вам на голову упадёт камень у второго моста - составляет 10%, а вероятность столкновения с коброй на третьем мосту = 20%, но только в восьми случаях из десяти змея Вас укусит. Ваши рассуждения здесь будут строго параметрическими, потому-что ни камни, ни кобры не пытаются предугадать Ваши действия, чтобы затем повлиять на Ваш выбор, к примеру, скрывая свои типичные модели поведения, так как им стало известно о Вашей потребности срочно перейти мост. Однако, если мы сейчас ещё больше усложним ситуацию, добавив непараметрический элемент, она станет более головоломной и любопытной. Предположим, что Вы какой-то беглец и Вас преследуют, поджидая на другом берегу реки со снайперской винтовкой. Предположим, муж любовницы может подстеречь и выстрелить в Вас, только если устроит засаду у моста, который Вы собираетесь перейти; в противном случае Вы уйдёте с линии огня и сбежите невредимым. Когда Вы рассуждаете, выбирая мост, Вам приходит в голову, что муж любовницы тоже сейчас пытается предугадать Ваш ход мыслей, и, полагаясь на свои выводы, избрать место для засады. Будет казаться, что выбор самого безопасного моста сразу же станет ошибкой, потому-что он слишком очевиден, и поэтому именно там Вас и будет поджидать человек с винтовкой, и Ваши шансы на смерть возрастут до степени гарантированных. Так что, возможно, Вам стоит рискнуть пройти по мосту с падающими камнями, поскольку там шансы на выживание гораздо выше. Но стоп!.. если Вы можете прийти к такому выводу, то Ваш преследователь, который также рационален и хорошо информирован, тоже может предположить, что Вы выберете этот мост, и будет ждать Вас именно там. Так что, возможно, Вам стоит рискнуть с кобрами; это тот выбор, которого муж любовницы меньше всего от Вас ожидает. Но и тогда... нет!..ведь если он предположит, что Вы выберете тот мост, которого он меньше всего будет ожидать, тогда он тоже выберет для засады именно самый опасный мост. И тут Вы со страхом понимаете, что эта дилемма носит общий характер: Вы должны делать то, чего Ваш преследователь меньше всего ожидает; но то, что Вы взаимно причисляете к разряду наименее ожидаемого, автоматически становится именно тем, чего Вы оба начинаете ждать в первую очередь!.. Кажется, Вы зашли в тупик и застряли в нерешительности. Единственное, что может Вас немного утешить, так это то, что на другом берегу реки Ваш преследователь попал в точно такое же затруднительное положение, не имея возможности твёрдо решить, у какого моста лучше стеречь, потому-что, как только он заляжет с винтовкой у одного из мостов, ему тут же начнут лезть в голову мысли, что, если он смог найти лучшую причину выбрать именно этот мост, значит, Вы тоже можете предвидеть ту же самую причину, а затем нарочно пойти по другому мосту. Из практического опыта мы знаем, что в подобных ситуациях люди обычно не "подвисают" на месте, и не колеблются вечно. Как мы увидим позже, каждому игроку доступно уникальное, лучшее именно для него решение. Однако до 1940-х годов ни философы, ни экономисты не знали, как вычислить такое решение математически. В результате, экономисты были вынуждены рассматривать непараметрические воздействия так, будто они представляют собой осложнения параметрических. Это, вероятно, покажется читателю странным, поскольку, как должен был показать пример с переходом через мост, именно непараметрические показатели часто являются главными и фундаментальными характеристиками при столкновении с проблемой принятия решения. Хотя, эта статья отнюдь не об основах экономики, для понимания происхождения и масштаба Теории игр важно знать, что совершенно конкурентные рынки породили собственную особенность, которая делает их уязвимыми для параметрического анализа. Поскольку агенты не несут никаких затрат за выход на рынки, они будут открывать магазины на любом доступном рынке до тех пор, пока конкуренция не сведёт всю прибыль к нулю. Это означает, что если производственные затраты фиксированы, а спрос является экзогенным, то у агентов нет выбора относительно того, сколько производить, в том случае, если они пытаются максимизировать разницу между своими затратами и доходами. Эти уровни производства могут быть определены отдельно для каждого агента, поэтому никому якобы не нужно обращать внимание на то, что делают другие; каждый агент рассматривает своих двойников и подражателей лишь как пассивные элементы окружающей среды. Философы разделяют с экономистами профессиональный интерес к условиям и методам максимизации прибыли и роста благосостояния. Кроме того, философы уделяют особое внимание логическому обоснованию действий: важно, чтобы действия были оправданы прогнозом ожидаемых результатов (одна традиция моральной философии, утилитаризм, основана на идее, что все заслуживающие оправданий действия должны быть не просто оправданы, но ещё и оправданы определённым образом). Точкой пересечения этих направлений является то, что без Теории игр обе описанные проблемы не поддаются анализу во всех ситуациях такого типа, при котором важную роль играют непараметрические аспекты. В следующих публикациях рассмотрим это подробнее на примере одной известной (хотя и не самой типичной) игры моделирования ситуаций - так называемой "дилеммы заключенного", и других подобных головоломок. При этом, мы представим, определим и проиллюстрируем их основные элементы и методы в рамках Теории игр. 10 августа 2020 г., Богдан Карасёв, на основе рефератов преподавателей Стенфордского университета. Источник: scorum.ru Комментарии: |
|