Ќагл€дное объ€снение теоремы Ѕайеса

ћ≈Ќё


√лавна€ страница
ѕоиск
–егистраци€ на сайте
ѕомощь проекту
јрхив новостей

“≈ћџ


Ќовости »»–азработка »»¬недрение »»–абота разума и сознаниећодель мозга–обототехника, ЅѕЋј“рансгуманизмќбработка текста“еори€ эволюцииƒополненна€ реальность∆елезо иберугрозыЌаучный мир»“ индустри€–азработка ѕќ“еори€ информациићатематика÷ифрова€ экономика

јвторизаци€



RSS


RSS новости


 Ћј——џ ¬≈–ќя“Ќќ—“»: ѕ–»Ћќ∆≈Ќ»≈

Ќесколько дней назад € предложил вам тему дл€ очередной заметки, и некоторое количество знаков разной степени €сности говорили в пользу того, что она вам интересна. ѕоэтому сегодн€ € вкратце опишу, что такое теорема Ѕайеса, что может дать бытовому мышлению и какое отношение к ней имеют классы веро€тности. —разу оговорюсь, что во многом опираюсь на эссе Ёлиезера ёдковского, ссылка на которое приведена мною в шапке данной заметки - и, если после этой заметки вы всерьЄз заинтересуетесь байесианским мышлением, насто€тельно советую его прочитать.

Ќаконец, о теореме Ѕайеса. Ёто, в сущности, проста€ формула из теории веро€тностей, котора€ св€зывает друг с другом разные веро€тности - как "чистыеФ (как, например, веро€тность того, что в колоде туз будет не на своЄм месте), так и условные (веро€тность того, что туз будет не на месте при том условии, что колода была новой). ¬ыгл€дит она так:

P(A|B) = P(B|A)*P(A)/P(B),

где P(A) - априорна€ веро€тность событи€ ј, а P(A|B) - условна€ веро€тность (веро€тность ј при условии того, что ¬ произошло). ‘ормула спокойно терпит самые разнообразные преобразовани€, как, например, замена делител€ P(B) на его эквивалентное представление P(B) = P(B|A)P(A) + P(B|~A)P(~A), где как ~ј обозначаетс€ событие Уне јФ веро€тности 1 Ц P(A).

Ќо в чЄм же еЄ прелесть?

ƒопустим, существует некоторое количество учЄных - например, 1% из них - которые считаютс€ самыми уважаемыми учЄными на планете. »х авторитет неоспорим, заслуги великолепны, и 90% из них учились в некоем институте с названием CIST. »звестно также, что 10% людей, которые не стали в итоге уважаемыми учЄными, тоже окончили этот институт. ¬опрос: насколько хорошей идеей окажетс€ решитьс€ окончить CIST, если желаешь стать уважаемым учЄным? »наче говор€, какова веро€тность того, что, окончив CIST, попадаешь в то самое Унекоторое количествоФ?

»нтуици€ становитс€ дл€ решающего задачу злейшим другом - известно, что на такую задачу большинство людей даЄт неправильный ответ (см. эссе по ссылке). Ћегко предположить, что если 90% уважаемых учЄных окончили CIST, то примерно столько же от окончивших CIST стали в итоге уважаемыми учЄными. ќднако такой подход в корне неверный, что легко заметить, если посчитать всЄ в конкретных числах.

ƒопустим, у нас есть 10000 учЄных, и выдающа€с€ часть составл€ет ровно сотню. “огда из уважаемых учЄных мы имеем 90 человек, окончивших CIST, а из остальных - уже 990. “огда из всех выпускников CIST мы имеем всего 90/(90+990) = 1/12 общего числа, кто достиг выдающихс€ успехов! Ќи в какое сравнение с 90%, правда?

“еорема Ѕайеса, помимо всего прочего, может послужить прекрасным инструментом дл€ исправлени€ подобных ошибок интуиции. ƒействительно, если мы возьмЄм еЄ в виде

P(A|B) = P(B|A)*P(A)/(P(B|A)P(A) + P(B|~A)P(~A)),

то в результате вычислений получим тот же самый ответ:

P(A|B) = 0.9*0.01/(0.9*0.01+0.1*0.99) = 1/12.

«десь мы использовали:

ј - достижение выдающихс€ успехов;

¬ - наличие диплома CIST.

ќднако часто крайне сложно считать любую мелочь в точных числах, тем более что конкретные веро€тности обычно неизвестны: например, как вычислить веро€тность того, что сосед сегодн€ придЄт домой поздно, застр€в в пробке? ѕоэтому система классов веро€тности, которую € предлагал некоторое врем€ назад (vk.com/almeriner?w=wall-195839302_179) может оказатьс€ крайне полезной дл€ оценок по Ѕайесу. ƒл€ анализа стоит ввести не только сами классы, но и алгебру дл€ них, основанную на их характерных величинах:

A ~ 0.98;

B ~ 0.82;

C ~ 0.5;

D ~ 0.18;

E ~ 0.02.

ќценочна€ таблица умножени€ и сложени€ классов:

A*M = M (ћ - произвольный класс, кроме E);

B*B = C;

B*C = C;

B*D = D;

C*C = D, C+C = A;

C*D = D, C+D = B;

D*D = E, D+D = C;

M*E = E, M+E = M.

¬ качестве примера оценки по Ѕайесу рассмотрим всЄ ту же задачу с учЄными и CIST (здесь и далее буквы ј и ¬ означают событи€ с определЄнной веро€тностью только в скобках после –; иначе это классы веро€тности):

P(A) -> E (веро€тность быть выдающимс€ учЄным достаточно низка);

P(B|A) -> B;

P(B|~A) -> D.

“огда оценка по Ѕайесу выгл€дит следующим образом:

P(A|B) = B*E/(B*E+D*A) = 1/(1+(D*A)/(B*E)) = 1/(1+D/E) = 1/(1+0.18/0.2) = 1/10.

¬ажной деталью, упрощающей работу с классами, €вл€етс€ группировка всех величин классов в максимально компактные образовани€ в формуле. Ќапример, в примере вместо того, чтобы сразу умножать и подставл€ть значени€, мы сначала поделили числитель и знаменатель на произведение ¬*≈. ƒелаетс€ это дл€ того, чтобы максимально уменьшить работу с числами, а взамен пользоватьс€ оценочной алгеброй умножени€ и делени€ классов. “аким образом, классы веро€тности позвол€ют значительно упростить работу с теоремой Ѕайеса, когда конкретное значение искомой веро€тности не необходимо знать с высокой точностью - как мы увидели, оценка в нашем случае дала результат, достаточно близкий к реальному.

ѕопробуйте потренироватьс€ в байесианском мышлении на бытовых ситуаци€х, которые встречаютс€ вам в жизни - оценить классы веро€тности очевидных величин и получить какую-нибудь неочевидную. ј ещЄ насто€тельно рекомендую ознакомитьс€ с эссе по ссылке в начале этой заметки, тем более, если вы дочитали еЄ до конца.


»сточник: lesswrong.ru

 омментарии: