Картели, коммунизм и теория игр

МЕНЮ


Искусственный интеллект
Поиск
Регистрация на сайте
Сбор средств на аренду сервера для ai-news

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация




RSS


RSS новости

Новостная лента форума ailab.ru


2019-10-31 19:15

Теория игр — раздел прикладной математики, изучающий оптимальные стратегии в играх. Политики, использующие теорию игр как аргумент, могут отстаивать совершенно разные идеи, зачастую противоречащие друг другу. Раз мы говорим о математике, то, очевидно, что кто-то просто неправ, верно? Конечно, как же иначе. Но есть один важный нюанс.

Люди зачастую строят правильные модели, делая неправильные выводы.

И, чтобы доказать ошибочность этих самых выводов и правильность наших, можно использовать симулятор математической игры, сделанный разработчиком компьютерных игр — Ники Кейсом. Возможно, вы уже натыкались на эту занимательную страничку в интернете.

Вы можете и сами поиграть, пройдя через все этапы, на которых автор объясняет, почему та или иная стратегия оказывается победной. Но мы сразу перейдем к песочнице.

Здесь можно настроить количество игроков, использующих ту или иную стратегию, изменить награды и фундаментальные правила: сколько раз игроки играют друг с другом за одну встречу, какова вероятность случайной ошибки (т.е. хода не по выбранной стратегии), а также как быстро сильные игроки вытесняют слабых из всего турнира.

Коротко о том, что здесь вообще происходит: Каждый игрок сталкивается с другим один или несколько раз. В каждой игре они выбирают: сотрудничать с оппонентом, либо предать его. Награды и штрафы можно назначить любые. Очевидно, что за предательство награда (или хотя бы общий размер выигрыша относительно оппонента) должна быть выше, иначе сотрудничать выгоднее для обоих игроков.

После того, как каждый игрок сыграет с другим назначенное количество раз, несколько «худших» игроков удаляются, а на их место встают копии лучших. Затем матчи повторяются (ходы в предыдущих встречах забываются).

Итак, давайте сначала пройдемся по основным и простым моментам, а затем перейдем к более сложно части — к самим «опытам».

Стратегии

Люди, попадая в различные жизненные ситуации, «играют» глубоко не задумываясь. Тем не менее, обычно они действуют согласно своим внутренним установкам, то есть при аналогичных условиях они будут действовать одинаково. А у думающего человека всегда будет набор конкретных стратегий для различных ситуаций. Конечно же, нельзя рассмотреть любые стратегии, поэтому рассмотрим только те, какие представлены в «эволюции доверия».

1.Имитатор

Как относятся к тебе, так ты и отвечаешь. Имитатор начинает с доверия, затем повторяет последний ход противника

2. Наивный

Добро всегда побеждает зло. Наивный всегда будет доверять.

3. Обманщик

Сильные должны есть слабых. Обманщик всегда будет предавать оппонента.

4. Злопамятный

Жулики неисправимы. Злопамятный сотрудничает до тех пор, пока его не предадут, затем он всегда предает.

5. Детектив

Действовать нужно справедливо, правда простаки все равно не удержат свое богатство. Детективу нужно четыре хода на «разогрев». Сначала он доверяет, затем предает, затем дважды доверяет. Если детектив ни разу не столкнется с обманом, он будет всегда предавать. Если столкнется хоть раз — будет действовать как имитатор.

6. Подражатель

Плохим ребятам нужно дать шанс. Подражатель доверяет на первом ходу и доверяет в ответ на доверие. Только после двух предательств подряд со стороны противника, подражатель начнет отвечать предательством и будет продолжать до следующего предложения сотрудничать. По сути подражатель — это как имитатор, но дающий шанс. Это бывает полезно, ведь иногда игроки ошибаются и делают ход не в соответствии со своей стратегией.

7. Простак

Если тебя бьют, значит ты делаешь что-то не так. Простак повторяет свой последний ход, если ему доверились и меняет ход на противоположенный, если его предали.

Вы еще не уснули? Отлично, теперь давайте смотреть, какая же из этих стратегий наиболее эффективная. Я уже знаю результаты различных опытов и сразу сделаю выводы, но если вы хотите меня проверить — лезьте в песочницу на сайте.

Базовые выводы:

  1. Если играть один раунд за встречу, то всегда победит Обманщик.Это вполне очевидно. Все предложенные выше стратегии начинают с доверия, кроме его линии. Если каждый игрок играет с другим, а затем уже мы ищем победителей, то Обманщик проиграет только тогда, когда награда за предательство будет меньше награды за сотрудничество. А зачем в таком случае ему было предавать?
  2. Чем больше раундов играется за матч, тем меньше шансов у Обманщиков победить. В то время как другие стратегии способны извлекать выгоду из сотрудничества, Обманщики начинают играть друг с другом, уходя в ноль или минус.
  3. Самая сильная стратегия в борьбе с Обманщиками — это Имитаторы.Имитаторы лучше всех реализуют преимущество нескольких раундов: дают себя предать лишь один раз, но друг с другом сотрудничают.
  4. Когда случаются ошибки — Подражатели становятся еще сильнее.Оказывается, прощение может служить и эгоисту. Ошибки заставляют имитаторов обманывать друг друга. В большом количестве игровых вариаций именно Подражатели побеждают все остальные стратегии. А в мирной обстановке, где предательство можно увидеть нечасто, им нет равных.
  5. Наивные все портят.Наивность — слишком глупая стратегия во многих случаях. Наивные кормят Обманщиков и Детективов, а при игре с Простаком случайная ошибка заставит Простака предать, а доверие со стороны Наивного сообщит, что последнего все устраивает, и Простак продолжит предавать. Впрочем, в условиях крайне выгодного сотрудничества и наличия вероятности ошибки, Наивные конечно победят Имитаторов. Но Подражатели остаются чемпионами и тут.

Так какой политический вывод?

А теперь применим все эти выводы на практике. Рассмотрим самую типичную игру, о которой вы наверняка слышали. Дилемма заключенного. Абстрактная ситуация заключается в выборе для двух заключенных: сдать другого или промолчать.

Правила игры: Награда за предательство доверяющегося —> награда за взаимное предательство —> награда за взаимное сотрудничество —> награда за доверие предающему.

Ошибка обычно исключена.

Вполне реалистичные условия, не так ли? Когда различные научно-популярные ресурсы показывают данную игру, они обычно делают разницу между большей и меньшей наградой крайне ощутимой. Например, удачно сдавший своего напарника заключенный выходит на волю, а сам напарник, промолчав, получает 10 или 20 лет тюрьмы. Но любой пример, удовлетворяющий вышеуказанному неравенству сгодится. К примеру, я выставил такие значения в «песочнице» :

А теперь забудьте о том, что речь идет о заключенных. Почти любая жизненная ситуация, предполагающая элемент выгодного сотрудничества, выглядит именно так. Не думайте о «предательстве», как о реальном предательстве. «Предательством» в игре можно назвать простой отказ от сотрудничества.

Итак, сыграем в игру один раз. А кто побеждает, если сыграть в игру только один раз? «Обманщик». (И да, хочу напомнить, что выше перечисленные стратегии, это не буквально типы людей. Один и тот же человек может использовать разные стратегии в разных играх — учитывайте это).

И действительно, вы можете наглядно убедиться в этом. Предательство дает выгоду при любом ходе противника (0/-3 против меньших наград за сотрудничество — -1/-5). Что бы не выбрал оппонент — рациональным решением всегда будет предать. Здесь неважно, как долго вы общались и общались ли вообще, предательство от этого менее выгодным не станет.

Каждый играет с каждым по одному разу. Затем игроки забывают прошлые игры.
Спойлер: он бы победил даже в одиночку.

Но что будет если играть несколько раундов? Теперь мы знаем прошлые ходы противника. Из прошлых тестов мы также знаем, что, чем больше проводится встреч подряд, тем меньше шансов у обманщика. Самым выгодным вариантом для обоих игроков становится сотрудничество.
В аппарате теории игр наиболее выгодная стратегия для одного игрока называется равновесной по Нэшу. А стратегия, приводящая к наибольшему выигрышу в сумме, называется парето-оптимальной. Сложив это с тем, что мы описали ранее, выходит, что в многократно повторяющейся «дилемме заключенного» есть стратегия, одновременно парето-оптимальная и равновесная по Нэшу.

Так, так, так. Интересно. Так какой политический вывод?!

Ну, как, какой. Во-первых, коммунизм невозможен.

В нашей жизни мы постоянно сталкиваемся с дилеммой заключенного. И далеко не всегда она является повторяющейся. Нередко с ней сталкиваются люди, которые никогда больше не увидят друг друга. Уровень эгоизма должен быть абсолютно минимален у обоих таких людей, а доверие к случайному незнакомцу — максимальным, чтобы они могли выбрать парето-оптимальную стратегию. Даже если мы представим, что весь человеческий род может отказаться от максимизации личных интересов, сама идея о том, что каждый человек будет доверять любому другому, кажется не только абсурдной, но и немного антиутопичной. Именно анти. По крайней мере, по моему мнению, а вы можете считать жизнь с отсутствием вызова и опасности прекрасной утопией, ваше право.

А что подразумевает под собой анархический коммунизм? Доверие друг к другу, взаимовыручка и магическое отсутствие «трагедии общин»(типичного отсутствия чувства вины за присвоение «общественного»). Впрочем, жизнь с одними и теми же людьми в одной коммуне, больше напоминает повторяющуюся дилемму заключенного. Тут добавляется еще один фактор — когда играют больше двух игроков, бывает не понятно, кто обманул кого. В условиях отсутствия конкретной информации, совместное проживание двух людей снова становится «однократной» дилеммой заключенного. К тому же, неужели добрые коммунисты собираются запрещать людям менять коммуну?

Во-вторых, картели и другие сговоры на свободном рынке не существуют… наверное.

Конечно же, покупать будут больше у той компании, которая продает более дешевый товар. То есть компания с низкими ценами получит весь рынок, если будет продавать товар хотя бы того же качества, что и другие. Сузим количество компаний на рынке до двух (предположим, что это только те компании, которые продают самый качественный товар). Для каждой из компаний выгоднее будет продавать товар по низкой цене. Но если компании войдут в сговор и будут продавать товар по высокой цене, то обе останутся довольны. Или нет? Возможность снижения цен никуда не пропадает. Поэтому для каждой компании постоянно действует дилемма заключенного, в которой выгодно предать.

Но погодите, мы ведь определили, что в долгосрочной перспективе компания, идущая навстречу сотрудничеству, победит? Компания, любящая сговоры не найдет другую компанию для «эксплуатации» потребителей? Если вы следили за этим примером внимательно, то, конечно, понимаете, что это не так. Компания, которая устанавливает низкие цены, забирает весь рынок, и на этом всё, никакой сторонний картель её не остановит. И это не исключение из правил, установленных теорией игр. Ведь выше мы установили, что с увеличением количества раундов шанс предателей победить лишь уменьшается. Условия игры бывают разные, и в экономике предатель забирает всё. По счастливому стечению обстоятельств, такое предательство оказывается невероятно полезным для общества, ведь делает богаче не только самого предателя, но и всех потребителей.

В реальной жизни конечно же нет никакого буквального предательства. Компании обычно просто не идут на такие сделки. Хотя, безусловно, мы можем назвать низкие и высокие цены «сотрудничеством» и «предательством», если захотим, но суть останется одна — в экономике господствует равновесие по Нэшу.

Конечно же, сразу найдется куча людей, которая сможет вспомнить реально существующие картели, совершенно не обращая внимания на роль государства в их образовании. К тому же, как мы видим, ситуации, описываемые теорией игр, чрезвычайно зависят, собственно, от правил игры, поэтому доказательная сила теории самой по себе крайне сомнительна. Рекомендую прочитать другие статьи в нашей группе, посвященные вопросу картелей и монополий, ориентированные на более экономический подход.

Так что же, в математике выгодно сотрудничать, а в реальной жизни — предавать?

Нет, конечно же нет. На самом деле, мы сталкиваемся «многораундовыми» математическими играми гораздо чаще, потому что наша жизнь не разделяется на матчи — мы помним все наши предыдущие раунды и «играем» с разными людьми всю жизнь. Каждый раз, когда вы идете в магазин, вы играете в завуалированную игру с продавцом. Покупка товара — это «доверие», его пропуск — «предательство». А продавец может «предать» вас, продав некачественный товар. Единственное ограничение — продавец может либо предать всех покупателей сразу, либо не предавать никого. То есть продавцам доступны только две стратегии — «обманщик» и «наивный». Угадайте, какая из этих стратегий более эффективная для вас, если почти каждый ваш противник — «злопамятный»? Сравните это с предыдущим примером. Как предатель в данных условиях сможет нажиться больше чем игроки, склонные к сотрудничеству?

Еще более понятная ситуация происходит с обычными отношениями между людьми. Люди договариваются между собой, и усердно выполняют соглашения — как официальные, так и условные. Безответственные и склонные к систематическим предательствам остаются не у дел, ведь с ними никто не будет договариваться, осторожные, но открытые люди — процветают. А государства делают то, что хотят, потому что народу их «предать» достаточно тяжело.

Итак, чему нас может научить теория игр?

Хрупкое на первый взгляд состояние общества, что мы имеем на данный момент, — это не проклятие, а дар. Обманщики окружают нас, и, пожалуй, всем стоит смириться с этой данностью. Но благодаря тому, что мы ожидаем обмана, часто отвечаем взаимностью, умеем прощать и открыто приветствуем сотрудничество, мы можем жить в относительном доверии к окружающим.

Всегда стоит помнить, что не все ситуации, где предатель забирает всё (как в случае с картельным сговором) оказываются полезными для общества. Попытки искоренить возможность предательства могут привести к увеличению количества таких ситуаций. Предателей станет меньше, а награда за предательства станет значительно больше, и честные люди проиграют.

Бороться нужно не с явлением предательства — бороться нужно с тем, кого предать нельзя.

Источники:
https://notdotteam.github.io/trust/ — поиграть в «Эволюцию доверия»
Роберт Аксельрод — «Эволюция сотрудничества» («The Evolution of Cooperation»)

Источник: m.vk.com

Комментарии: