В предыдущей заметке мы начали обсуждать Закон Очень Больших Чисел — один из законов Принципа Невероятности Д. Хенда, описанный в его книге Improbability Principle. Продолжаем

МЕНЮ


Главная страница
Поиск
Регистрация на сайте
Помощь проекту
Архив новостей

ТЕМЫ


Новости ИИРазработка ИИВнедрение ИИРабота разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика

Авторизация



RSS


RSS новости


ЗОБЧ гласит, что "если попыток достаточно много, то вероятность наблюдать маловероятное событие хотя бы один раз становится сколь угодно велика". Формула для вероятности увидеть событие хотя бы один раз из n попыток: 1-(1-p)?. Если pn мало, это примерно pn; если pn порядка единицы и р мало, то это примерно 1-е???. Если же pn больше 7, то это вероятность больше 0.999. При каком хотите малом p.

Например. Пусть есть некий раствор, и в каждом кубическом миллиметре за секунду может Произойти Нечто с вероятностью р. Сколько таких кубиков в Мировом океане? Объём океана примерно 1.5 млрд кубокилометров, а один кубокм это млрд кубометров, а тот — млрд кубомм. Получаем 1.5 на 10 в степени 27. В году примерно 10 млн секунд, то есть за год степень 34. За миллион лет степень около 40. Если вероятность р ничтожно мала — имеет степень около -30 — то событие практически неизбежно.

Но сейчас мы поговорим о п?о?и?с?к?е? ?ш?а?б?л?о?н?о?в в серии испытаний.

Например, бросая монету, мы генерируем серию плюс-минус единиц, и по Закону Больших Чисел среднее стремится к математическому ожиданию — к нулю. Это означает, что сумма выигрышей и проигрышей растет медленнее, чем количество игр, причем есть хорошие оценки: можно считать, что выигрыш-проигрыш где-то между плюс-минус 3 корня из числа игр. Однако серия 1, -1, 1, -1, ... очень маловероятна, и если вы видите такую, она, скорее всего, не случайна. Будут серии из единиц (поперло!), серии из минус единиц (не везет!), да в достаточно длинной последовательности будет вообще всё, что только вздумается! А если оно там есть, то его там можно найти.

По поводу серий из двух побед подряд, трех, и так далее. Они должны быть, и вероятность их известна: это закон Пуассона. То же касается и двумерных серий, например, попаданий бомб или ракет. Если падают они более или менее равновероятно, то попадания в одно и то же место два, три и более раз должны встречаться, если бомб падает достаточно много. Проф. Хенд приводит пример: обстрел Лондона снарядами V1 во время Второй Мировой войны. Статистики, изучив карты попаданий, выяснили, что снаряды не наводились (не управлялись) и падали случайно, хотя кратные попадания, конечно, наблюдались.

То же самое касается карт распространения заболеваний, особенно незаразных (с заразными доминирует передача от больного к здоровому). Вспышка случаев в данной местности может иметь причину, но может быть случайной. И надо понимать, что кто ищет, то всегда найдет. Но не всегда то, что искал.

Очень ярко проявляется принцип при отслеживании трафика для предотвращения атак в сети, например. Серия коротких запросов может быть атакой, но может и не быть. Поднимать тревогу попусту плохо, но и прозевать угрозу — тоже плохо. Довольно изощренная математика используется для анализа потоков запросов — кумулятивные суммы и т.п.

Принцип техасского стрелка из этой же оперы. Стрелок палит в стену сарая, а потом рисует мишень так, чтобы у центра было побольше попаданий. Такое место обязательно найдется.

Очень много совпадений можно найти в длинных текстах. Так, слово Тора образовано каждой пятидесятой буквой первой книги Торы "Берешит" (дословно "во-первых", так и говорят). Доверяю Хенду, сам не проверял. Учитывая, что свиток Торы написан без пробелов и знаков препинания и заглавных букв в иврите нет... У Диккенса в Записках Пиквикского клуба можно найти слова fate и doom, если буквы брать через три. Сам Хенд нашел в своей же рукописи слово help два раза. Ну, вы понимаете, как это делается.

Нумерология — неиссякаемый источник удивительных совпадений. Плохо помню Войну и Мир, но эпизод, как герой подгоняет численные значения букв так, чтобы получилось то, что он хочет — помню хорошо)) Сам я очень люблю число 666 и ищу его повсюду, и нахожу. Вот еще пример.

Атака на Торговый центр в США, то самое 9/11 (кстати, неимоверно раздражает манера ставить месяц раньше числа! Поди пойми, 11/12 —- это декабрь или ноябрь?) Хенд приводит следующие совпадения вокруг зловещего числа 11:

Дата атаки: 9/11 -> 9+1+1=11

После 11 сентября 111 дней до конца года.

11 сентября — это 254 день года, 2+5+4=11

Бомбардировка Бали (не в курсе, что за) произошла через 1 год, 1 месяц и 1 день после 9/11.

Первый самолет был рейс 11 авиакомпании АА (American Airlines), A первая буква, так что опять 11. И команда насчитывала 11 человек.

Рейс 175 — 65 человек на борту. 6+5=11.

Штат Нью-Йорк — 11-ый, присоединившийся к США.

Строительство Пентагона началось 11 сентября 1941 года.

Сам Торговый центр строился 11 лет.

Таких совпадений можно найти много, и самому, и в интернете. Надо только проверять, потому что врут много.

Цифры числа пи можно считать равновероятными, и там можно найти самые удивительные шаблоны. Не удивлюсь, если где-то далеко закодирован весь Властелин Колец. Число е радует с самого начала: е=2.7(1828)(1828)459045... Два раза год рождения Льва Толстого, не баран чихнул! А потом углы равнобедренного прямоугольного треугольника.

В больших массивах данных должны встречаться (и встречаются) самые удивительные структуры. При анализе данных нельзя полагаться на невероятность совпадения! Надо использовать строгие статистические методы, и проверять. Помню, как меня поразила в детстве история открытия позитрона. Ученый наблюдал треки (следы траекторий) заряженных частиц в магнитном поле — они искривлены. И увидел два симметричных трека, искривленных в разные стороны. Электрон и позитрон! Но вдруг это два электрона, один из которых вылетел из данной точки, а второй летел к ней? Это возможно один раз, но при повторе опыта увидеть такое же совпадение снова?? Нереально! Однако был поставлен контрольный эксперимент, со свинцовой стенкой. Она замедлит частицы и кривизна трека увеличится. Стало ясно, что маловероятное совпадение исключено. Позже я понял, что треков очень много, и ученый искал характерные "вилки". И конечно, нашел бы, и нашёл бы что угодно, именно потому, что их много.

Часть третья будет посвящена Закону Выбора (не путать с аксиомой выбора!).


Источник: vk.com

Комментарии: