Теория игр: история, философия и психология в Теории игр

2020-08-11 15:25

Теория игр - это направление изучения способов, которыми выбор взаимодействующих экономических агентов приводит к предпочтительным результатам или пользе ОТ (или ДЛЯ) этих агентов, причём полученные результаты не могли быть заранее достоверно спланированы ни одной из сторон.

Смысл этого утверждения не будет понятен неспециалисту до тех пор, пока каждый аспект приведённой формулировки не объяснить и не рассмотреть на конкретных примерах. Это и будет основной задачей цикла ближайших публикаций.

Однако, сначала рассмотрим психологический и философский контексты, чтобы заинтересовать нас к дальнейшему более углублённому освоению технической стороны теории.

1. Философско-историческая мотивация

Теория игр в той форме, в которой она известна экономистам и социологам, получила свою первую общую математическую формулировку в 1944 году - от Джона фон Неймана и Оскара Моргенштерна. По причинам, которые будут обсуждены позже, ограниченность их формальной структуры трактовки, изначально делала теорию применимой только в особых и узко-специфичных условиях. Эта ситуация кардинально изменилась в последующие семь десятилетий, по мере того, как рамки теории были расширены и обобщены. Доработки всё ещё ведутся, и в ближайших публикациях мы рассмотрим несколько нерешённых проблем, лежащих на переднем крае этих разработок.

Однако, по крайней мере с конца 1970-х годов, уже можно было с уверенностью сказать, что Теория игр является наиболее важным и полезным инструментом в наборе аналитика - всякий раз, когда он сталкивается с ситуациями, в которых то, что считается лучшим действием одного агента, зависит от ожиданий другого участника.
То, что будут делать один или несколько агентов, и то, что считается их лучшими действиями - аналогичным образом зависит от ожиданий всех сторон.

Несмотря на то, что Теория игр начала становиться математически и логически систематизированной только с 1944 года, теоретико-игровые идеи можно найти у исследователей, восходящих к древним временам. Например, в двух текстах Платона, Laches и Symposium, Сократ вспоминает эпизод из битвы при Delium, который некоторые историки интерпретировали (вероятно, анахронично) как связанный со следующей ситуацией. Представьте себе солдата на фронте, который вместе со своими товарищами ждёт отражения атаки врага. Ему может прийти в голову, что если защита будет успешной, то маловероятно, что его личный вклад в победу будет существенным. Но если он останется, то рискует быть убитым или раненым - очевидно, без всякого смысла для него лично (т.к. разгром вражеской армии и так гарантирован). С другой стороны, если противник обладает потенциалом для победы в битве, то шансы вышеупомянутого солдата на смерть или ранение ещё выше, и отсюда ещё более очевидно, что нет смысла воевать, так как линия в любом случае будет разбита. Исходя из этих рассуждений, может показаться, что солдату в любом случае лучше сбежать - независимо от того, кто выиграет битву. Конечно, если все солдаты будут рассуждать таким образом - а все они, по-видимому, с высокой долей вероятности могут рассуждать примерно одинаково, поскольку все они находятся в одинаковом положении, - то это обязательно приведет к исходу, в котором битва будет проиграна. Конечно, этот момент, раз уж он пришел в голову нам, как аналитикам, может приходить в голову и солдатам. Даёт ли это им повод оставаться на своих постах? Напротив: чем больше у солдат страха, что битва будет проиграна, тем больше у них мотивации дезертировать. И чем больше у солдат веры в то, что битва будет выиграна без необходимости участия какого-либо конкретного человека (тебя лично), тем меньше у них причин оставаться и сражаться. Если каждый солдат предполагает, что остальные рассуждают примерно так же, как он, тогда все быстро впадают в панику, и их напуганный командир будет деморализован ещё до того, как враг вступит в бой.

Задолго до появления теории игр, которая показала аналитикам, как систематически думать о подобном типе проблем, нечто подобное пришло в голову некоторым выдающимся военачальникам и повлияло на их стратегии.

Подобным образом, испанский завоеватель Кортес, высадившись в Мексике с небольшим отрядом, и имея веские причины опасаться нерешительности своих солдат при отражении атак гораздо более многочисленных ацтеков, устранил риск того, что его войска могут подумать об отступлении: он сжёг у берега корабли, на которых они прибыли. Поскольку отступление стало физически невозможным, у испанских солдат не было лучшего варианта действий, чем стоять и сражаться до конца - и, более того, сражаться со всей решимостью, на которую они только были способны.

С точки зрения Кортеса, его действия оказали деморализующее воздействие на мотивацию ацтеков. Он сжёг свои корабли демонстративно, чтобы ацтеки наверняка это увидели. Затем они должны были рассуждать примерно следующим образом: любой командир, который может быть настолько уверен в победе, что намеренно уничтожает собственный флот и путь отступления на тот случай, если битва сложится для него неудачно, должен иметь веские причины возникновения такой самоуверенности. Уже трудно так же смело, как раньше, атаковать оппонента, у которого есть веская причина (какой бы она ни была!) уверенности в том, что он не проиграет. Поэтому ацтеки отступили в холмистую местность, и Кортес одержал невероятно лёгкую победу.

У этих двух ситуаций - в Delium, и у конкистадоров, манипулируемых Кортесом - есть одна общая и любопытная логика. Обратите внимание, что солдаты не мотивированы на отступление только (или даже в основном) из-за их рациональной сравнительной оценки опасностей битвы и своих личных интересов. Скорее, они обнаруживают вескую причину для побега, понимая, что то, что для них имеет смысл делать, зависит от того, что будет иметь смысл и для других, и что все остальные тоже могут рассуждать примерно так же.
Поэтому даже довольно храбрый солдат может предпочесть бежать, а не героически, но бессмысленно умереть, пытаясь в одиночку остановить надвигающуюся атаку. Таким образом, мы могли бы вообразить, без противоречия, такие обстоятельства, при которых армия, все члены которой храбры, убегает с максимальной скоростью, прежде чем противник сделает хотя бы первый ход. Если солдаты действительно храбры, то, конечно, никто из них не хочет бежать; каждый предпочел бы, чтобы все стояли и сражались. Таким образом, мы имеем дело с парадоксальной ситуацией, когда взаимодействие множества индивидуально рациональных процессов принятия решений - по одному процессу на каждого солдата - может приводить к результату, которого никто не желал (и большинство современных армий понимают важность решения этой проблемы так же, как понимал Кортес). Поскольку они обычно не могут сделать отступление физически невозможным, то делают его "экономически" невозможным, просто расстреливая дезертиров. В конце концов, стоять и сражаться - это индивидуальный рациональный образ действий каждого солдата - после того, как его оценка явственно показала, что "цена" побега обязательно будет не ниже "стоимости" удержания позиции.

Ещё один классический источник, предлагающий эту последовательность рассуждений, находится в произведении Шекспира "Генрих Пятый". Во время битвы при Азенкуре Генрих V решил зарезать своих французских пленных на виду у врага, к удивлению своих подчинённых, которые описали затем это действие, как выходящее за пределы допустимых моральных норм. Причины, которые Генрих приводит в качестве стратегических соображений своего поступка: он боялся, что пленные могут освободиться и поставить под угрозу его положение. Однако, теоретик игр мог бы предоставить ему дополнительное стратегическое (и такое же разумное - хотя, возможно, и аморальное) оправдание.
Его собственные войска замечают, что пленные были убиты, и понимают, что враг тоже видел это. Поэтому они знают, какая судьба их ожидает в плену у врага, если они не победят и сдадутся. Образно, зато очень эффективно, их "корабли для отступления" были сожжены. Убийство пленных, вероятно, послужило сигналом для солдат обеих сторон, тем самым изменив их стимулы таким образом, чтобы они больше благоприятствовали перспективам победы англичан.

Правда, изначально эти примеры могут показаться актуальными только для тех, кто живёт в трудных условиях жёсткой конкуренции. Многие могут подумать, что это важно для генералов, политиков, боссов мафии, спортивных тренеров и прочих альфа-доминантов, чья работа связана со стратегическим манипулированием другими людьми, а вот философ мог бы только пожалеть о своей аморальности, если бы принял для себя подобный концептуальный фундамент. Однако, такой вывод был бы весьма преждевременным. Изучение логики, которая управляет взаимоотношениями между стимулами, стратегическими взаимодействиями и результатами, было фундаментальным в развитии современной политической философии, за много веков до того, как у кого-либо родилось однозначное определение (название) для подобного рода логики. Философы разделяют с социологами убеждение в необходимости иметь возможность представлять и систематически моделировать не только то, что, по их мнению, люди согласно нормативным требованиям должны делать, но и то, что они часто фактически делают в интерактивных ситуациях - нередко, вопреки логике и морали.

"Левиафан" Гоббса часто рассматривается как основополагающий труд в современной политической философии - это текст, который положил начало непрерывному анализу и оправданию функций государства, а также его ограничивающей политике в отношении личных свобод. Суть рассуждений Гоббса можно прямо сформулировать следующим образом. Лучшая ситуация для всех людей - это когда каждый волен делать то, что ему заблагорассудится (можно согласиться или не согласиться с этим с точки зрения психологии или идеологии, но речь идёт о постулатах Гоббса). Часто такие свободные люди желают сотрудничать друг с другом для выполнения проектов, которые были бы невозможны для отдельного игрока, т.е. нереальны для исполнения в одиночку. Но если вокруг есть какие-либо моральные или аморальные агенты, они заметят, что их интересы, по крайней мере, иногда могут быть лучше всего удовлетворены, в ситуации взаимовыгодного сотрудничества, а не в изоляции. Предположим, например, что Вы согласны помочь Толяну построить его дом - в обмен на его обещание потом помочь Вам построить Ваш дом. После того, как дом Толяна будет построен, он может обмануть Ваши ожидания, просто нарушив своё обещание. Затем Толян может поразмыслить и осознать, что, если у Вас не будет своего дома, тогда у Вас появятся стимулы и планы по отъёму его дома. Это заставит его постоянно бояться Вас, и вынудит тратить драгоценное время и ресурсы на защиту себя от Ваших (даже чисто гипотетических) притязаний. Лучше всего он может минимизировать эти затраты, нанеся удар первым, и убив Вас при первой же возможности. Конечно, Вы можете предвидеть весь ход его рассуждений, и тогда у Вас появится веская причина, чтобы попытаться убить его раньше. Поскольку Толян мог предвидеть и это рассуждение с Вашей стороны, его первоначальный страх перед Вами уже перестаёт быть параноидальным. Фактически, ни одному из вас даже не обязательно быть аморальным человеком, чтобы запустить эту цепочку взаимных рассуждений; вам нужно только подумать о том, что существует некоторая вероятность развития сценария, при котором другой пойдёт на обман, не выполнив условия сделки.

Как только небольшой клин сомнений вбивается в сознание любого человека, стимул, вызванный страхом перед последствиями упреждения - ударить прежде, чем будешь атакованным - быстро становится доминирующим у обеих сторон. Если у кого-то из нас есть собственные ресурсы, которые могут понадобиться другому, эта убийственная логика может укорениться даже задолго до того, как кому-то придёт в голову идея о каком-либо взаимовыгодном сотрудничестве.

Предоставленные самим себе, агенты, которые, по крайней мере, хотя бы иногда проявляют исключительное корыстолюбие, могут неоднократно упускать выгоды из возможного сотрудничества, и вместо этого оказываются в ловушке состояния беспричинной "войны всех против всех". В этих обстоятельствах человеческая жизнь, как метко выразился Гоббс, будет "...одинокой, бедной, мерзкой, жестокой и короткой".

В качестве решения этой проблемы Гоббс предложил тиранию (диктатуру). Люди могут нанять агента - правительство, задача которого наказывать любого, кто нарушит какое-либо взятое на себя обязательство. Пока угроза наказания достаточно ужасна, цена невыполнения обещания будет превышать стоимость его выполнения. Логика здесь идентична той, что используется армией, когда она угрожает расстреливать дезертиров. Если все люди будут знать, что эти стимулы действуют для большинства других, то сотрудничество станет не только возможным, но и ожидаемой нормой, так что война всех против всех переродится во всеобщий мир и сотрудничество.

Гоббс доводит логику этого аргумента до очень убедительного вывода, который подразумевает целесообразность существования не только демократичного правительства, наделённого правом и властью принуждать к сотрудничеству, но и всевластия, при котором произвольная воля единственного диктатора может налагать абсолютные обязательства на всех. Немногие современные политические теоретики думают, что конкретные шаги, которыми Гоббс обосновывает свой путь к этому выводу, являются одновременно здравыми и реалистичными. Однако, углублённое рассмотрение этих вопросов здесь увело бы нас от заданной темы - к деталям договорной политической философии. Что важно в данном контексте, так это то, что эти детали, в том формате, в котором они фактически исследуются в современных дебатах, включают в себя сложную интерпретацию проблем с использованием ресурсов современной Теории игр. Более того, основная мысль Гоббса о том, что фундаментальным оправданием принудительной власти и практики правительств является собственная потребность людей защищать себя от того, что теоретики игр называют "социальными дилеммами", принимается, как здравая, множеством (если не большинством) политических теоретиков. Обратите внимание: Гоббс не утверждал, что диктатура сама по себе желательна. Структура его аргумента заключается в том, что логика стратегического взаимодействия оставляет в своей квинтэссенции возможными всего лишь два конечных политических результата: либо тиранию, либо анархию. В результате, разумные участники игры будут склонны выбирать тиранию - как меньшее из двух зол.

В рассуждениях солдат Кортеса и политических агентов Гоббса есть общая логика, вытекающая из обстоятельств их положения. В каждом отдельном случае аспект среды, который является наиболее важным для достижения агентами их предпочтительных результатов, представляет собой набор ожиданий и возможных реакций на стратегии их оппонентов. Различие между параметрическим воздействием на пассивный мир и непараметрическим воздействием на мир, который пытается действовать активно в ожидании этих результатов, является фундаментальным. Если Вы хотите пнуть камень вниз с холма, Вам нужно беспокоиться только насчёт массы горной породы и силы своего удара - в какой степени она связана с опорной поверхностью, наклоном земли с другой стороны камня, и ожидаемым воздействием на камень от толчка Вашей ногой. Значения реакции камня на все эти переменные не зависят от Ваших планов и намерений, поскольку камень не имеет собственных интересов в этом деле, и не предпринимает никаких ответных действий, чтобы попытаться помочь / или помешать Вам. Напротив, если Вы захотите столкнуть с холма человека, то в таком случае, если этот человек не без сознания, не связан (или иным образом недееспособен), Вы, скорее всего, не добьетесь лёгкого успеха, если только не сумеете замаскировать свои планы, пока для жертвы не станет слишком поздно уклоняться или упреждать Ваши действия. Кроме того, следует ожидать, что вероятные реакции жертвы могут обернуться для Вас расходами, которые Вам следует заранее принять во внимание. Наконец, относительная вероятность интенсивности ответных действий будет зависеть от ожиданий человека относительно Ваших возможных реакций на его контр-выпады (подумайте, как это повлияет на Ваши рассуждения, если один или оба из вас вооружены, или один из вас больше другого, или один из вас является начальником другого в социуме). Логические проблемы, связанные со вторым типом ситуации (пнуть ногой человека, а не камень) обычно ещё более сложны, что проиллюстрирует простой гипотетический пример.

Предположим для начала, что Вы хотите пересечь реку, через которую проведены три моста (допустим, что переплыть, перейти вброд или переправиться на лодке - невозможно). Первый мост, как известно, безопасен и не имеет препятствий; если Вы попытаетесь там перейти, у Вас всё получится гладко. Второй мост находится под обрывом, с которого иногда на путников падают большие камни. Третий мост населен агрессивными кобрами, которые ревниво смотрят на любого прохожего. Теперь предположим, что Вы хотите расположить три моста в порядке их предпочтения, начиная с относительно безопасной точки переправы и заканчивая наиболее опасным. Если Вы не получаете особого специфического удовольствия от риска своей жизнью - концепция, которую, будучи человеком, Вы тоже можете иметь, но мы рассмотрим её в другой раз, - тогда выбор для Вас окажется очевиден. Понятно, что первый мост лучше, так как он самый безопасный. Для ранжирования двух других мостов Вам потребуется информация об их относительных уровнях опасности. Если Вы сможете какое-то время изучать частоту камнепадов и проблески приветливого настроения у кобр, в зависимости от погоды, Вы сможете рассчитать, что вероятность того, что Вам на голову упадёт камень у второго моста - составляет 10%, а вероятность столкновения с коброй на третьем мосту = 20%, но только в восьми случаях из десяти змея Вас укусит. Ваши рассуждения здесь будут строго параметрическими, потому-что ни камни, ни кобры не пытаются предугадать Ваши действия, чтобы затем повлиять на Ваш выбор, к примеру, скрывая свои типичные модели поведения, так как им стало известно о Вашей потребности срочно перейти мост.
Что делать в такой модели, очевидно: просто перейти по самому безопасному мосту.

А теперь немного усложним сценарий. Предположим, что мост со скалами и падающими камнями будет прямо перед Вами, а безопасный мост - на расстоянии дневного перехода через джунгли вверх по течению реки. Ваша "развилка" с принятием решения становится немного сложнее, но она всё ещё строго параметрическая. Вам нужно будет решить, стоит ли обменять "стоимость" длительного похода через джунгли на риск в размере 10% вероятности падения камня на голову. Однако это всё, что Вы должны будете решить, и Ваша вероятность успешного перехода полностью зависит от Вас, потому-что окружающая природа нисколько не интересуется Вашими планами, и не будет пытаться нарочно им противодействовать.

(По крайней мере, не в этом конкретно взятом лесу, и не на этом конкретно рассматриваемом отрезке времени).

Однако, если мы сейчас ещё больше усложним ситуацию, добавив непараметрический элемент, она станет более головоломной и любопытной. Предположим, что Вы какой-то беглец и Вас преследуют, поджидая на другом берегу реки со снайперской винтовкой. Предположим, муж любовницы может подстеречь и выстрелить в Вас, только если устроит засаду у моста, который Вы собираетесь перейти; в противном случае Вы уйдёте с линии огня и сбежите невредимым. Когда Вы рассуждаете, выбирая мост, Вам приходит в голову, что муж любовницы тоже сейчас пытается предугадать Ваш ход мыслей, и, полагаясь на свои выводы, избрать место для засады. Будет казаться, что выбор самого безопасного моста сразу же станет ошибкой, потому-что он слишком очевиден, и поэтому именно там Вас и будет поджидать человек с винтовкой, и Ваши шансы на смерть возрастут до степени гарантированных. Так что, возможно, Вам стоит рискнуть пройти по мосту с падающими камнями, поскольку там шансы на выживание гораздо выше. Но стоп!.. если Вы можете прийти к такому выводу, то Ваш преследователь, который также рационален и хорошо информирован, тоже может предположить, что Вы выберете этот мост, и будет ждать Вас именно там. Так что, возможно, Вам стоит рискнуть с кобрами; это тот выбор, которого муж любовницы меньше всего от Вас ожидает. Но и тогда... нет!..ведь если он предположит, что Вы выберете тот мост, которого он меньше всего будет ожидать, тогда он тоже выберет для засады именно самый опасный мост. И тут Вы со страхом понимаете, что эта дилемма носит общий характер: Вы должны делать то, чего Ваш преследователь меньше всего ожидает; но то, что Вы взаимно причисляете к разряду наименее ожидаемого, автоматически становится именно тем, чего Вы оба начинаете ждать в первую очередь!.. Кажется, Вы зашли в тупик и застряли в нерешительности. Единственное, что может Вас немного утешить, так это то, что на другом берегу реки Ваш преследователь попал в точно такое же затруднительное положение, не имея возможности твёрдо решить, у какого моста лучше стеречь, потому-что, как только он заляжет с винтовкой у одного из мостов, ему тут же начнут лезть в голову мысли, что, если он смог найти лучшую причину выбрать именно этот мост, значит, Вы тоже можете предвидеть ту же самую причину, а затем нарочно пойти по другому мосту.

Из практического опыта мы знаем, что в подобных ситуациях люди обычно не "подвисают" на месте, и не колеблются вечно. Как мы увидим позже, каждому игроку доступно уникальное, лучшее именно для него решение. Однако до 1940-х годов ни философы, ни экономисты не знали, как вычислить такое решение математически. В результате, экономисты были вынуждены рассматривать непараметрические воздействия так, будто они представляют собой осложнения параметрических. Это, вероятно, покажется читателю странным, поскольку, как должен был показать пример с переходом через мост, именно непараметрические показатели часто являются главными и фундаментальными характеристиками при столкновении с проблемой принятия решения.

Отчасти, объяснение относительно позднего проникновения Теории игр в эту область кроется в вопросах, которые исторически больше интересовали экономистов. Например, классических экономистов, таких как Адам Смит и Дэвид Рикардо, в основном интересовал вопрос о том, как агенты на очень крупных рынках - целых странах - могут взаимодействовать, чтобы обеспечить себе максимальное денежное богатство. Основная идея Смита состоит о том, что эффективность возрастает больше всего, когда агенты сначала дифференцируют свой потенциальный вклад, а затем свободно ищут взаимовыгодные сделки - была математически подтверждена в двадцатом веке. Однако демонстрация этого факта применима только в условиях "совершенной конкуренции", то есть когда отдельные лица или фирмы не несут затрат на вход или выход на рынки, когда нет эффекта масштабирования, и когда никакие действия агентов не имеют непреднамеренных последствий и побочных эффектов на положение других агентов. Экономисты всегда признавали, что этот набор допущений является чистой идеализацией - с целью анализа, а не возможным в реальности положением дел, которое когда-либо смогут попытаться (или должны захотеть попытаться) установить институционально. Но до тех пор, пока ближе к концу 1970-х годов не созрела математика Теории игр, экономистам приходилось надеяться, что чем больше рынок приближается к идеальной конкуренции, тем более эффективным он будет становиться. Однако никакие подобные надежды не могут быть математически или логически обоснованы вообще; заблудность этой теории установили ещё в 1950-х годах.

Хотя, эта статья отнюдь не об основах экономики, для понимания происхождения и масштаба Теории игр важно знать, что совершенно конкурентные рынки породили собственную особенность, которая делает их уязвимыми для параметрического анализа. Поскольку агенты не несут никаких затрат за выход на рынки, они будут открывать магазины на любом доступном рынке до тех пор, пока конкуренция не сведёт всю прибыль к нулю. Это означает, что если производственные затраты фиксированы, а спрос является экзогенным, то у агентов нет выбора относительно того, сколько производить, в том случае, если они пытаются максимизировать разницу между своими затратами и доходами. Эти уровни производства могут быть определены отдельно для каждого агента, поэтому никому якобы не нужно обращать внимание на то, что делают другие; каждый агент рассматривает своих двойников и подражателей лишь как пассивные элементы окружающей среды.

Другой тип ситуаций, в которых классический экономический анализ может быть применён без обращения к Теории игр, - это ситуация, когда монополия сталкивается с множеством потребителей. Здесь, пока ни один покупатель не представляет собой достаточно большой доли спроса, чтобы оказывать стратегическое влияние на рынок, непараметрические соображения отпадают, и задача фирмы состоит только в том, чтобы определить комбинацию цены и объема производства, при которой она максимизирует прибыль. Однако совершенная / и монополистическая конкуренция - это очень разные и уникальные рыночные механизмы. Таким образом, до появления Теории игр экономисты были строго ограничены классом обстоятельств, к которым они могли напрямую применять свои модели.

Философы разделяют с экономистами профессиональный интерес к условиям и методам максимизации прибыли и роста благосостояния. Кроме того, философы уделяют особое внимание логическому обоснованию действий: важно, чтобы действия были оправданы прогнозом ожидаемых результатов (одна традиция моральной философии, утилитаризм, основана на идее, что все заслуживающие оправданий действия должны быть не просто оправданы, но ещё и оправданы определённым образом). Точкой пересечения этих направлений является то, что без Теории игр обе описанные проблемы не поддаются анализу во всех ситуациях такого типа, при котором важную роль играют непараметрические аспекты.

В следующих публикациях рассмотрим это подробнее на примере одной известной (хотя и не самой типичной) игры моделирования ситуаций - так называемой "дилеммы заключенного", и других подобных головоломок. При этом, мы представим, определим и проиллюстрируем их основные элементы и методы в рамках Теории игр.

10 августа 2020 г., Богдан Карасёв, на основе рефератов преподавателей Стенфордского университета.

Телеграм: t.me/ainewsline

Источник: scorum.ru

Теория игр: история, философия и психология в Теории игр

Комментарии: