Отрывок из книги экономиста Авинаша Диксита, посвященный параллелям между биологией и теорией игр, системам принятия решений и смешанным стратегиям

2017-10-03 15:00

Биологическая теория эволюции основана на трех фундаментальных принципах: гетерогенность (неоднородность), приспособленность и отбор. Исходное положение состоит в том, что поведение животных в значительной мере генетически предопределено: комплекс из одного или более генов (генотип) обусловливает схему поведения (поведенческий фенотип). Естественное разнообразие генофонда обеспечивает гетерогенность фенотипов в популяции. Одни модели поведения в большей степени соответствуют сложившимся условиям, чем другие; успех фенотипа выражается в виде количественного показателя под названием приспособленность.

Люди привыкли думать об успехе так, как о нем говорится в распространенной, но вводящей в заблуждение фразе «выживание наиболее приспособленных», тем не менее высший критерий биологической приспособленности — не выживание, а репродуктивный успех. Именно это позволяет животному передавать свои гены следующему поколению и сохранять свой фенотип. Затем более приспособленные фенотипы становятся относительно более многочисленными в следующем поколении, чем менее приспособленные. Именно этот динамический процесс отбора меняет комбинацию генотипов и фенотипов и, возможно, в конечном счете приведет к формированию устойчивого состояния.

Время от времени спонтанно возникают новые генетические мутации. Многие из них создают модели поведения (фенотипы), которые плохо сочетаются с окружающей средой и поэтому вымирают. Однако иногда мутация приводит к образованию нового фенотипа, более приспособленного к окружающей среде. Такой мутантный ген может захватить популяцию, то есть образовать значительную ее долю.

В любой момент времени популяция может содержать некоторые или все биологически возможные фенотипы. Доля более приспособленных фенотипов будет увеличиваться, некоторые неприспособленные могут исчезнуть, а фенотипы, в настоящий момент не входящие в состав данной популяции, могут попытаться ее захватить. Биологи называют конфигурацию популяции и ее текущих фенотипов эволюционно устойчивой, если ни один мутантный фенотип не может успешно ее захватить. Это статический критерий, но чаще применяется более динамический критерий: конфигурация популяции эволюционно устойчива, если она представляет собой единственно возможный результат динамического процесса отбора, начиная с любой произвольной комбинации фенотипов в данной популяции. [* ]

Приспособленность фенотипа зависит от взаимодействия отдельного организма с окружающей средой. Например, приспособленность определенной птицы зависит от аэродинамических характеристик ее крыльев, а также от всего комплекса разных генотипов, которые существуют в соответствующей среде: как аэродинамика крыльев птицы соотносится с аэродинамическими свойствами крыльев остальных птиц данного вида. Стало быть, приспособленность определенного животного (с его поведенческими характеристиками, такими как агрессивность и стадность) зависит от того, являются ли другие представители этого вида преимущественно агрессивными или пассивными, живут стаями или поодиночке и т. д. Для наших целей подобное взаимодействие между фенотипами в пределах одного вида — самый интересный аспект всей истории. Иногда представители одного вида взаимодействуют с представителями другого вида; тогда приспособленность определенного типа овец, например, может зависеть от качеств, доминирующих в местной популяции волков. Мы рассмотрим и этот тип взаимодействия, но только после анализа взаимодействия в пределах одного вида.

Все вышесказанное имеет свои параллели в теории игр. Поведение фенотипа можно рассматривать как стратегию животного в его взаимодействии с другими животными, например драться или спасаться бегством. Разница лишь в том, что выбор стратегии осуществляется не в результате целенаправленных расчетов, как в стандартной теории игр, а скорее, это генетически предопределенный вариант фенотипа. Взаимодействие обеспечивает фенотипам выигрыши. В биологии они отображают эволюционную или репродуктивную приспособленность; когда же мы используем эти идеи за пределами биологии, они могут иметь иной смысл, подразумевающий успех в социальных, политических и экономических играх.

Выигрыши или показатели приспособленности можно представить в виде таблицы выигрышей, точно так же, как и в обычной игре. В такой таблице все возможные фенотипы одного животного отображаются в строках матрицы, а другого животного — в столбцах матрицы. Если одновременно взаимодействуют больше животных (в биологии это называется игрой по всему полю), то выигрыши можно представить в виде функций, как в играх с коллективным действием из главы 11. В этой главе мы в основном будем рассматривать пары игроков, а случай со многими игроками кратко проанализируем в разделе 7.

Поскольку популяция представляет собой комбинацию фенотипов, различные пары, выбранные из нее, используют во взаимодействии различные сочетания стратегий. Фактический количественный показатель приспособленности фенотипа — это средний выигрыш, который он получит во всех своих взаимодействиях с другими членами популяции. Животные с более высокой приспособленностью будут иметь более крупный эволюционный успех. Итогом динамики популяции станет ее эволюционно устойчивая конфигурация.

Биологи весьма успешно применили этот подход. Комбинации агрессивного и кооперативного поведения, местоположение гнездовий и многие другие явления, не поддающиеся более традиционному объяснению, можно рассматривать как устойчивые результаты эволюционного процесса отбора более приспособленных стратегий. Интересно, что биологи сформулировали идею эволюционных игр, воспользовавшись уже накопленными знаниями в области теории игр и ее терминами, но при этом изменив предположение об осознанных попытках обеспечить максимальное удовлетворение своих потребностей. Теперь специалисты по теории игр, в свою очередь, используют результаты исследований в области биологических эволюционных игр для обогащения своей области знаний*. [* ]

Действительно, создается впечатление, что теория эволюционных игр — готовая концептуальная модель для изучения двух систем принятия решений Канемана. [* ] В других областях применения этой теории, не имеющих отношения к биологии, идею о том, что животные используют генетически заданные стратегии, можно интерпретировать более широко. Во взаимодействии между людьми стратегия может быть заложена в разуме человека по разным причинам, среди которых не только генетика, но и социализация (по всей вероятности, еще более важный фактор), культурное воспитание, образование или эмпирический опыт, основанный на прошлых событиях. Все это может охватывать инстинктивная, быстрая система 1 Канемана. Популяция может состоять из совокупности разных людей с разным происхождением или опытом, под влиянием которого они придерживаются различных стратегий системы 1. Так, некоторые политики стремятся соблюдать определенные моральные или этические нормы, даже рискуя успехом на выборах, тогда как другие озабочены только своим переизбранием. Точно так же некоторые компании могут гнаться исключительно за прибылью, тогда как другие преследуют социальные или экологические цели. В рассматриваемом контексте мы можем назвать все логически возможные стратегии, которые могут быть внедрены таким способом, фенотипом популяции игроков.

Из популяции с ее гетерогенностью встроенных стратегий случайным образом многократно выбираются пары фенотипов для взаимодействия (ведения игры) с другими представителями того же или иного «вида». В каждом взаимодействии выигрыш каждого игрока зависит от стратегий обоих; эта зависимость регулируется обычными «правилами игры» и отображается в таблице или дереве игры. Приспособленность конкретной стратегии определяется как ее совокупный или средний выигрыш, полученный в паре со всеми стратегиями данной популяции. У одних стратегий более высокий уровень приспособленности, чем у других, и в следующем поколении (то есть в следующем раунде игры) их используют больше игроков, что обеспечит их размножение. Стратегии с более низким уровнем приспособленности выберут меньше игроков, поэтому их число постепенно сойдет на нет и они исчезнут. Время от времени кто-то может экспериментировать или выбрать из множества логически возможных стратегий ту, которая еще не применялась. Эта ситуация соответствует появлению мутанта.

Хотя мы используем биологическую аналогию, причина увеличения количества более приспособленных стратегий и исчезновения менее приспособленных отличается от сугубо генетического механизма биологии: игроки, которые добились успеха в предыдущем раунде, передадут информацию друзьям и коллегам, играющим в следующем раунде, а игроки, плохо сыгравшие в предыдущем раунде, увидят, какие стратегии оказались более эффективными, и попытаются их имитировать. Другими словами, процесс целенаправленных размышлений и пересмотра предыдущих эмпирических правил происходит между раундами. Такие «социальные» и «обучающие» механизмы передачи информации гораздо важнее в большинстве стратегических игр, чем любая биологическая генетика; в действительности именно так подкрепляется ориентация законодателей на переизбрание и заинтересованность компаний в максимизации прибыли. И наконец, осознанное экспериментирование с новыми стратегиями замещает случайную мутацию в биологических играх. Постепенный процесс изменений с учетом исходов, опыта, наблюдений и экспериментов образует динамику расчетливой, медленной системы 2 Канемана.

Существует два типа эволюционно устойчивых конфигураций биологических игр. Во-первых, один фенотип может оказаться более приспособленным, чем другие, и популяция может состоять только из него. Такой эволюционно устойчивый результат обозначается термином мономорфизм, что означает «одна (моно) форма (морф)». В этом случае одна преобладающая стратегия называется эволюционно устойчивой стратегией (evolutionary stable strategy, ESS). Во-вторых, у двух или более фенотипов может быть одинаковый уровень приспособленности (и выше по сравнению с некоторыми другими генотипами, не принимающими участия в игре), поэтому они могут сосуществовать в определенных пропорциях. Тогда говорят, что популяция демонстрирует полиморфизм, то есть «множественность (поли) форм (морф)». Такое состояние будет устойчивым, если ни один новый фенотип или возможный мутант не сумеет достичь более высокого уровня приспособленности против данной популяции, чем уровень приспособленности тех типов, которые уже в ней присутствуют.

Полиморфизм очень близок к такому понятию теории игр, как смешанная стратегия. Однако есть одно важное отличие. Для получения полиморфизма ни одному отдельно взятому игроку не нужно придерживаться смешанной стратегии. Каждый член популяции может использовать чистую стратегию, но популяция в целом демонстрирует смешивание стратегий, поскольку различные игроки придерживаются различных чистых стратегий.

Вся эта структура (популяция, возможная комбинация фенотипов, таблица выигрышей при взаимодействии с другими фенотипами и правило эволюции соотношения фенотипов в популяции в зависимости от уровня их приспособленности) образует эволюционную игру. Эволюционно устойчивую конфигурацию популяции можно назвать равновесием в эволюционной игре.

Отрывок из книги экономиста Авинаша Диксита, посвященный параллелям между биологией и теорией игр, системам принятия решений и смешанным стратегиям

Комментарии: