Основные теоремы в теории игр |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-02-08 16:30 Математик Алексей Савватеев о теории игр, управлении выборами и равновесии Нэша Прежде чем разбираться с целями и задачами теории игр, я расскажу историю, которая близка каждому из нас. Утром вы думаете, как ехать на работу. Владельцы автомобилей решают вопрос с пробками и парковкой. Если автомобиль оставить около подъезда, то предсказать время на дорогу можно с точностью до нескольких минут. Точность работы нашего городского транспорта очень высока. Мы сядем за руль только в том случае, если есть надежда оказаться в нужном месте быстрее. С востока Москвы на юг я еду час на метро. Если ехать на метро и МЦК, путь займет час и пятнадцать минут. Если я сажусь за руль, я ожидаю, что доеду за 45 минут. Сам я не вожу автомобиль, поэтому речь идет не обо мне, а о типовом москвиче, у которого есть машина. Он думает, сесть за руль или нет. В итоге сел, проехал 40–45 минут и оказался быстрее. Реальность такого расклада зависит от пробок. Пробка возникает, когда много тысяч других людей поехали той же дорогой на машине — в вашу жизнь вмешиваются решения, принятые другими людьми. Когда человек решает, садиться за руль или нет, он взвешивает только свое собственное время. Если человек в итоге садится за руль, он создает негативное давление на окружающих — это отрицательная экстерналия. Он загружает дороги, и если много людей выберут ехать на машине, то 45 минут превратятся в два часа. Утром, принимая решение о выборе транспорта, вы решаете теоретико-игровую задачу, которую одновременно с вами решает все население города. Это большое событие с большим количеством игроков, и для описания таких процессов существует теория игр. Теория игр описывает много разных процессов. Представим ситуацию выборов. Есть кандидаты A, B и C. Вы хотите, чтобы прошел кандидат C, но, исходя из опросов, которые проводились, мы понимаем, что кандидат C непроходной, 1–2% максимум. Вы понимаете, что если будете голосовать за него, то ваш голос в итоге выльется в то, что кандидат B не пройдет во второй тур. В итоге выиграет кандидат A, который вам не нравился. Поэтому вы решаете голосовать за B, раз C — непроходной вариант. В результате возможна дискоординация. Все хотели голосовать за C, но не верили, что C проходной. Или ситуация, когда никто не знал, проходной он или непроходной, но заказали опрос, на котором объявили результаты, что C непроходной. Такое в некоторых странах случается. Такими опросами люди хотят повлиять на ситуацию. Человек создает в голове некоторые представления о действиях других игроков и о том, какие у них функции выигрыша. Если любителей C много и они знают, что их много, то C может победить. Если любителей C много, но они считают, что они все в меньшинстве, то C не победит, потому что они будут голосовать за B против A. Возникает ситуация равновесия. Таких историй из нашей окружающей реальности можно много вспомнить, поэтому важно изучать теорию игр.Теория игр — метод, когда мы берем и формализуем ситуацию с конкретным списком игроков. У каждого игрока чемоданчик, который он открывает, — там пульт управления его действиями. Он выбирает кнопку, которую должен нажать. Все остальные игроки тоже нажимают кнопки. В ситуации с транспортом решение, сесть за руль или нет, — это бинарный выбор: да или нет. Существуют ситуации сложнее. Например, выбор маршрута, когда вы уже сели за руль. Когда каждый игрок выбирает стратегию, складывается равновесие. В ситуации с транспортом каждый выбирает дорогу и средство передвижения. В результате этого равновесия возникают выигрыши игроков. В случае с транспортом выигрыш — сэкономленное время. Равновесие — согласованный прогноз, который можно объявить вслух, и каждый игрок, сопоставив информацию, поймет, что сделал правильный выбор. Прогнозы, которые можно объявить, а после каждый решит, что он будет действовать так, как сказано, называются равновесными. Пример неравновесного прогноза: мэр города решил, что много пробок, и с утра разрешил садиться за руль тем, у кого фамилии начинаются на букву А. Представим себе, что некто, у кого фамилия начинается на букву Б или В, верит в то, что остальные действуют согласно словам мэра, значит, дороги будут пустые, поэтому этот некто садится за руль. Из этого следует только одно: такой прогноз не будет выполнен. Мы не знаем, кто будет отклоняться и в какую сторону, но ясно, что прогноз неравновесный. Концепцию равновесия в 1838 году придумал Антуан Огюст Курно, анализируя рынок зерна во Франции. Курно рассматривал, какие объемы зерна привезут разные фермеры, угадывая действия друг друга, и как цена будет складываться в зависимости от количества зерна. Американский математик Джон Нэш доказал теорему существования, которая связана с равновесными прогнозами. Рассмотрим любую игру, где есть конечное количество n игроков. У каждого игрока конечный список стратегий и произвольные функции выигрыша — функции, которые определяют, сколько теряет или приобретает игрок в зависимости от выбранной стратегии. Математически это означает: задано n функций на прямом произведении множеств всех стратегий. Эта ситуация называется игрой. В некотором специальном смысле слова равновесие всегда существует. В прямом смысле слова существует прогноз, который можно объявить, и он выполнится. Каждый будет действовать согласно этому прогнозу, но это утверждение будет неверным. Рассмотрим самую простую игру — орлянка. Ты берешь монету и зажимаешь ее, а я пытаюсь угадать, орлом ты ее зажал или решкой. У меня две стратегии, и у тебя две стратегии. Четыре реализации: орел — орел, орел — решка, решка — орел, решка — решка. Если я угадал, я выигрываю бутылку кефира и полбатона. Проигрываю тоже бутылку кефира и полбатона. В этой игре равновесий в смысле объявленных прогнозов быть не может. У нас четыре ситуации, и в каждой из них ясно, что кто-то будет действовать не так, как сказано. Если сказано, что ты зажимаешь решкой и я должен говорить вслух слово «решка», то ты зажмешь орлом, чтобы выиграть, а не проиграть. Но если сказать, что ты зажимаешь решкой, а я скажу «орел», то я скажу «решка», чтобы выиграть. Равновесие здесь существует в другом смысле слова, более аккуратном.Наши действия в этой ситуации можно сравнить с подбрасыванием монеты. Ты подбрасываешь ее и зажимаешь тем, чем получилось, и я подбрасываю и зажимаю, чем получилось. Если мне сообщить, что ты правда ее подбрасываешь, то мне бессмысленно пытаться угадать решку или орла. Любой расклад я угадаю только в одном из двух случаев. Поэтому я говорю, что мне все равно на выбор стратегии, поэтому я тоже буду бросать монету и говорить результат, который выпадет. В этом смысле ответом на стратегию выбрасывания монеты является стратегия выбрасывания монеты. Такая смешанная пара стратегий называется равновесием Нэша. В ситуациях с транспортным моделированием люди распадаются на страты, внутри которых одни садятся за руль, а другие нет. В таких транспортных моделях всегда есть равновесия, потому что это смешанные стратегии, в которых необязательно 50 на 50. Это и есть теорема, которую доказал Джон Нэш. Джон Нэш кроме стратегических игр изучал игры динамические и кооперативные. В динамических играх много нерешенных проблем и вопросов. В одном случае одна концепция равновесия разумна или другая. Кооперативные игры — игры, в которых идет взаимодействие без стратегий: все собираются и начинают вместе решать. В таких играх свои условия устойчивости и участия. Динамически кооперативные игры, в которых взаимодействие постоянно меняется путем заключения договоров. В таких играх много открытых математических вопросов. Они напрямую моделирует жизненные ситуации, поэтому теория игр — наука, которая дает ключ к нашему миру. Источник: postnauka.ru Комментарии: |
|