Часть вторая: использование коэффициента Байеса для оценки мастерства размещения ставок |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-01-18 16:27 В первой части этой статьи Джозеф Бухдаль представил идею использования коэффициента Байеса для проверки мастерства размещения ставок. Теперь на примере реальных историй ставок он показывает, каким образом можно выяснить, навыки игрока или удача лежат в основе конечного результата. В первой части этой статьи я представил коэффициент Байеса как показатель, с помощью которого можно сравнивать соотношение сил двух конкурирующих статистических гипотез. Неудивительно, что его можно использовать и для анализа размещения ставок. Во второй части я проанализирую три примера использования коэффициента Байеса в этом контексте. В частности, я попытаюсь определить, влияет ли мастерство игрока, делающего ставки, на получение прибыли. Анализ сводки результатов ставок с помощью коэффициента Байеса Наверное, самый очевидный способ выяснить, обладает ли игрок какими-либо навыками, — сравнить результаты, которые он ожидает получить на основе своей методологии прогнозирования, с предположениями букмекера. Обычно букмекер ожидает (или хотя бы надеется), что каждый игрок, сделавший ставку, потеряет процент от прибыли, определенный его маржой. Для популярных рынков Pinnacle эта величина обычно составляет около –2,5 %. С помощью коэффициента Байеса можно оценить вероятность того, что игрок, полагающийся на свои навыки, сможет получить результаты лучше обычных, демонстрируя таким образом уровень своего мастерства. В графике ниже представлены коэффициенты вероятности (LR) и Байеса (BF), рассчитанные с помощью функции NORMDIST в Excel (как описано в первой части) для игрока, делающего 1000 ставок с азиатским гандикапом или на разницу в счете с коэффициентом 1,95 и ожидаемым уровнем прибыли +5 % (H1). При условии маржи на уровне –2,5 % подразумеваемые справедливые коэффициенты и вероятность выигрыша каждой ставки составляют 2,00 и 50 % соответственно (H0). На графике показано, как коэффициенты LR и BF меняются относительно наблюдаемой доходности. Если игрок, сделавший ставки, получает ожидаемый доход +5 %, BF = 13,7 и LR = 19,3. По версии Джеффриса, это можно считать серьезным, но не решающим аргументом в пользу получения такого результата благодаря мастерству, а не по счастливой случайности. Сравните этот показатель с p-значением, равным 0,75 % (или 1 из 133). Очевидно, анализ с использованием коэффициента Байеса покажет более консервативный результат, чем эквивалент p-значения. И это вполне естественно. Слишком часто игроков, делающих ставки, могут вводить в заблуждение низкие показатели p-значений, заставляя считать, что они указывают на мастерство, хотя на самом деле эти показатели обозначают возможность возникновения случайного события без учета навыков. Если вам удается обыграть справедливые коэффициенты линии закрытия на +5 %, ваша ожидаемая прибыль составляет 5 %. А проверка больших выборок данных о коэффициентах футбольных матчей показала, что вы, как правило, будете зарабатывать +5 %. Решающим доказательством мастерства получения +5 % станет случай, когда игроку, делающему ставки, нужно будет получить доход около +7,4 % после 1000 ставок. Но при такой результативности лучше использовать другую версию H1 (например, H1 = 7,4 %), и ее можно проверить в сравнении с исходным значением H1 = +5 % или даже H0 = –2,5 %. Помните: анализ с использованием коэффициента Байеса лишь сравнивает относительные вероятности двух гипотез, но не делает «истинной» ни одну из них. Чтобы получить убедительный уровень доказательства (BF = 100), что наблюдаемая доходность соответствует предполагаемому преимуществу в размере +5 % при условии маржи букмекера –2,5 %, необходимо сделать около 1675 ставок. Для такого результата p-значение теперь будет составлять 0,08 % (или 1 из 1250). Некоторые специалисты по статистике настоятельно рекомендуют устанавливать существенно более строгий пороговый показатель p-значения, прежде чем заявлять о статистической значимости. К примеру, Нассим Талеб (Nassim Taleb), автор книг «Одураченные случайностью» (Fooled by Randomness) и «Черный лебедь» (The Black Swan), рекомендует использовать минимальное p-значение на уровне 0,1 %. В этом примере оно будет очень близко к коэффициенту Байеса со значением 100. На графике ниже показано, как коэффициенты LF и BF меняются в зависимости от размера выборки ставок для этого сценария, в котором H0 = –2,5 %, H1 = +5 %, а наблюдаемая результативность строго соответствует значению H1. Коэффициент BF обычно меньше LR, когда H1 и наблюдаемое значение близки, из-за использования распределения вероятностей для описания H1. Вследствие этого повышается неопределенность и снижается уверенность, связанная с применением определенного значения H1, использованного в тесте коэффициента чистой вероятности. Если H1 продолжает удаляться от наблюдаемого значения, коэффициент BF может превышать LR, что четко видно на графике выше, как и в примере с подбрасыванием монетки, приведенном в первой части. Разумеется, изменение коэффициентов очень существенно влияет на показатели. При коэффициенте 5,00 наблюдаемой результативности +5 % с H1 = +5 % и H0 = –2,5 % для 1000 ставок и более коэффициент Байеса составит всего 2,89. Чем больше коэффициенты, тем больше разброс и выше неопределенность. Полностью исключить влияние удачи невозможно, хотя при p-значении, равном 4,57 %, некоторые наблюдатели могут предпочесть сделать именно это. Чтобы получить BF = 100, потребуется сделать около 3500 ставок. Эквивалентное p-значение снова составит около 0,08 % (или 1 из 1250). При коэффициенте 7 необходимо сделать 10 400 ставок, чтобы получить убедительное значение H1, и снова p-значение равно 0,08 % (1 из 1250). Очевидно, Талеб и Джеффрис мыслят в одном направлении. Подтверждение адекватности модели с помощью коэффициента Байеса Коэффициент Байеса можно также использовать как своего рода средство для проверки адекватности модели. При такой проверке, когда фактические результаты априори очень близки к ожидаемым (прогнозным), он является показателем поведения модели в соответствии с предполагаемым шаблоном. С августа 2015 года я публикую рекомендации по ставкам на основании методологии коллективного мнения, в которой обоснованность (эффективность) коэффициентов ставок на футбольные матчи от Pinnacle используются как основа для определения вероятности «истинных» результатов. Гипотеза методологии состоит в том, что соотношение коэффициентов других букмекеров к коэффициентам Pinnacle без учета их маржи позволяет получить ожидаемое значение. Например, если bet365 предлагает коэффициент 2,5 на то, что «Ливерпуль» (Liverpool) победит «Манчестер Сити» (Manchester City), а Pinnacle устанавливает справедливый коэффициент 2,4 после исключения маржи, ожидаемое значение для такой ставки составляет 2,5 / 2,4 = 4,17 %. Ожидаемое значение, рассчитанное на основе выборки ставок, — это просто среднее ожидаемое значение таких ставок. Зная определенное ожидаемое значение истории ставок (H0), мы можем напрямую сравнить его с фактическим доходом (H1) после каждой ставки. Чем ближе ожидаемый и фактический доходы, тем выше вероятность, что методология работает в соответствии с прогнозом. Коэффициент Байеса позволяет делать подобное сравнение адекватности модели. Чем ближе это значение к единице, тем лучше ожидание соответствует результату. Представленная ниже схема с временным рядом отображает изменение коэффициентов вероятности и Байеса после каждой ставки во временном ряду. Низкие результаты первых 1000 ставок означали, что анализ с использованием коэффициента Байеса не помог исключить ошибку в модели, так как имелись умеренные доказательства существенного отличия ожидаемой результативности (H0) от фактической (H1). Затем результативность снизилась до прогнозируемого среднего значения, а оба коэффициента LR и BF лишь изредка существенно отклонялись от единицы. После 9681 матча ожидаемый доход составлял 4,18 %, в то время как фактический был на уровне 4,02 %. Проверка гипотезы о ценности линии закрытия с помощью коэффициента Байеса Читатели, знакомые с моими работами, знают, что я поддерживаю гипотезу о ценности линии закрытия (CLV). В ее основе лежит идея о том, что коэффициенты линии закрытия (итоговые коэффициенты), в частности для рынка футбольных ставок 1X2, представляют лучшую из возможных оценок вероятности выигрыша. Это прекрасный способ прогнозирования фактической доходности ставок. Слишком часто игроков, делающих ставки, могут вводить в заблуждение низкие показатели p-значений, заставляя считать, что они указывают на мастерство, хотя на самом деле эти показатели обозначают возможность возникновения случайного события без учета навыков. Если вам удается обыграть справедливые коэффициенты линии закрытия на +5 %, ваша ожидаемая прибыль составляет 5 %, а проверка больших выборок данных о коэффициентах футбольных матчей показала, что вы, как правило, будете зарабатывать +5 %. Впрочем, я не исключаю возможности, что эта гипотеза не всегда точна. Более того, в сентябре 2019 года я исследовал неэффективность рынка ставок на теннисные матчи, отслеживая результативность теннисного типстера @nishikoripicks, доход которого составлял +8,6 % при ожидаемом коэффициенте по гипотезе CLV –0,3 %. Такое расхождение служит ярким показателем вероятных проблем с гипотезой CLV (по крайней мере, в теннисе). С помощью коэффициента Байеса мы можем узнать, насколько существенным является этот показатель. Опять же, следуя методологии, описанной в первой части, я рассчитал коэффициенты вероятности броска и Байеса после каждой ставки в сводке результатов ставок игрока @nishikoripicks и представил их на приведенном ниже графике. При этом под evH0 понимается суммарная ожидаемая ценность линии закрытия. Для каждой ставки ожидаемая ценность линии закрытия рассчитывается как соотношение рекомендуемых коэффициентов ставок игрока @nishikoripicks и итоговых коэффициентов без учета маржи Pinnacle. Например, если ставка составляла 2,5, а итоговый коэффициент без учета маржи — 2,45, ожидаемая ценность линии закрытия будет (2,5 / 2,45) – 1 = 2,041 %. Следовательно, суммарная ожидаемая ценность линии закрытия — это среднее значение для всех предыдущих ставок. Под evH1 понимается эквивалент текущего дохода после каждой ставки. Поэтому он обновляется после каждой ставки, как и evH0. Иначе говоря, текущий доход игрока @nishikoripicks после каждой ставки посчитали лучшим показателем фактической ожидаемой ценности. Хотя коэффициент Байеса обычно более консервативен, чем коэффициент вероятности (как мы заметили ранее, когда наблюдаемые данные соответствовали H1), они в целом имеют много общего. После приблизительно 2000 ставок появляется стабильная решающая разница между двумя моделями для ожидаемого дохода игрока @nishikoripicks. К концу этой истории BF = 1912, а LR = 2704. Если предположить, что фактический доход игрока @nishikoripicks соответствует точному показателю его ожидаемого дохода, гипотеза о ценности линии закрытия в этом случае будет, скорее всего, неправильной. Конечно, такой анализ с использованием коэффициента Байеса не говорит нам о том, что фактический доход игрока @nishikoripicks является точным показателем ожидаемого дохода, мы просто допустили такую возможность в этом анализе. Он просто показывает, что в таком случае это определенно лучше, чем гипотеза о ценности линии закрытия. Но может также случиться, что нам повезет больше, чем ожидалось. Возможно, истинный ожидаемый доход составляет 5 %. В таком случае при сравнении двух моделей, когда H1 = +5 % и H0 = –0,3 %, коэффициент BF будет составлять всего 11,8. Кроме того, остается вероятность, что Pinnacle не соответствует рыночной активности игрока @nishikoripicks не в связи с неэффективностью рынка, а по другим причинам. Пока мы не знаем, сколько ставок делает он и его клиенты, а также делают ли они их вообще на Pinnacle, остается вероятность, что линии не ведут себя ожидаемым образом (то есть с показателем 8,6 % + маржа). Просто потому, что их активность недостаточна для столь существенного смещения. В отличие от неудачи игрока @nishikoripicks при смещении линий в соответствии с гипотезой о ценности линии закрытия, другой игрок, делающий ставки, результаты которого я проанализировал для своей статьи об использовании линии закрытия при проверке своих навыков в размещении ставок, демонстрирует изменение коэффициентов, в целом соответствующее гипотезе. Сводка результатов ставок этого игрока на теннис в 2019 году состоит из 2223 ставок, демонстрируя ожидаемое значение линии закрытия на уровне 2,96 % и фактический доход с равных ставок в размере 4,37 % (хотя его фактическая прибыль была немного меньше из-за изменчивых сумм ставок). Если H1 = 4,37 % и H0 = 2,96 %, то LR = 1,22 и BF = 0,86. Следовательно, ни одна модель не имеет преимущества перед другой. Учитывая ставки на другие виды спорта, его общая результативность за 2019 год до настоящего момента характеризуется такими показателями: количество ставок = 14 333; ожидаемый доход = 2,92 %, фактический доход с равных ставок = 3,51 %, LR = 1,25, BF = 0,88. При условии, что случайное смещение коэффициентов, подобное демонстрируемому этим игроком, совершенно невозможно, такие показатели полностью подтверждают действительность гипотезы о ценности линии закрытия. Хотя игрок @nishikoripicks не видит некоторого снижения коэффициентов (около 3 %), остается открытым вопрос, почему этот показатель не значительно больше и почему он соответствует его фактической прибыли. Недостатки коэффициента Байеса Как мне кажется, существенным недостатком коэффициента Байеса является то, что он все же очень похож на частотное p-значение, поскольку в его основе лежит вероятность появления данных при условии истинности гипотезы или модели. Настоящий успех байесовской статистики объясняется тем, что она определяет обратное — вероятность истинности гипотезы на основании полученных данных. Возможно, поэтому коэффициент Байеса немного недооценивают. Собственно, более полное выражение, основанное на вероятности истинности гипотезы, представлено ниже: Показатели P(H0) и P(H1) — априорные вероятности истинности двух конкурирующих гипотез, а P(H1|D) и P(H0|D) — апостериорные вероятности истинности показателей H1 и H0 при наличии наблюдаемых данных. Если P(H1) = P(H0), коэффициент Байеса, в частности, является коэффициентом апостериорных вероятностей, а также указывает на вероятность того, что одна из моделей более истинна, чем другая. Тем не менее проблема байесовской статистики заключается в том, что мы зачастую не знаем, какие априорные вероятности моделей являются истинными. Какова априорная вероятность, что гипотеза о ценности линии закрытия истинна? Соответствует ли она априорной вероятности того, что фактическая результативность игрока @nishikoripicks является достоверным показателем его ожиданий? Пока остаются сомнения об априорных вероятностях, байесовский анализ всегда ограничен. Стоит отметить, что сомнения и неуверенность всегда сопровождают байесовскую статистику, ведь «истина» не абсолютна, а скорее вероятностна, и она всегда обновляется с появлением новых данных. Чем больше данных мы получаем, тем ближе «истина». Что мы узнали о коэффициенте Байеса и мастерстве размещения ставок? Из этой пары статей мы узнали, как можно использовать коэффициент Байеса для проверки результативности конкурирующих гипотез игрока, делающего ставки, например сравнить мастерство и удачу, определить причины происходящего и узнать, соответствуют ли результаты ожиданиям. Благодаря этому игрок, делающий ставки, получает еще один инструмент, который поможет ему определить свой уровень мастерства. Для большинства результатов размещения ставок коэффициента вероятности будет вполне достаточно. Его можно использовать вместо коэффициента Байеса, который сложнее вычислить. Источник: m.vk.com Комментарии: |
|