Мир полон вероятностей и неопределенностей, но понять природу случайности дано не каждому

МЕНЮ


Новости ИИ
Поиск

ТЕМЫ


Внедрение ИИНовости ИИРобототехника, БПЛАТрансгуманизмЛингвистика, рбработка текстаБиология, теория эволюцииВиртулаьная и дополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информации

АРХИВ


Июнь 2017
Май 2017
Апрель 2017
Март 2017
Февраль 2017
Январь 2017
Декабрь 2016
Ноябрь 2016
Октябрь 2016
Сентябрь 2016
Август 2016
Июль 2016
Июнь 2016
Май 2016
Апрель 2016
Март 2016
Февраль 2016
Январь 2016
0000

RSS


RSS новости
птичий грипп

Новостная лента форума ailab.ru

2017-01-04 14:02

Кластеризация

Мир полон вероятностей и неопределенностей, но понять природу случайности дано не каждому. Если подброшенная монета 5 раз выпала орлом, чего следует ожидать при следующем броске? Если ваш ответ “решка”, подумайте снова. Орлы и решки равновероятны, у случайных событий нет памяти о том, что случилось прежде.

Даже лучшие математики заблуждались относительно закономерностей случайных явлений. Понадобились века, чтобы в них разобраться.

Простая задача: в семье два ребенка и известно, что хотя бы один из них - мальчик. Какова вероятностей, что в семье два мальчика? Многие ответят, - ?, потому что с такой вероятностью второй ребенок окажется мальчиком. Но правильный ответ - ?: из четырех равновероятных исходов (два мальчика; старший мальчик, а младшая - девочка; и т.д.) один вариант (две девочки) по условию задачи исключен.

Казино зарабатывает на нашем недопонимании случайности. А те, кто в курсе, применяют свои знания и в поиске новых спасительных лекарств, и в расчетах выигрыша на гонках.

? Нераскрываемый код

Использование случайных чисел позволяет решить ключевую для нашего времени задачу обеспечения информационной безопасности. Ее роль в этом деле впервые оценил во время Первой мировой войны дешифровщик американской армии майор Джозеф Моборн (Joseph Maugborgne). Вместе со своими коллегами он расшифровывал секретные сообщения, отыскивая едва заметные закономерности в закодированных сигналах, позволяющих сопоставлять из с буквами и словами. Именно Моборн сообразил, что все закономерности исчезнут, если перед трансляцией сигнал смешать со случайной последовательностью символов (к коду каждого символа добавлять случайное число). Расшифровать такой поток может лишь обладатель ключа - единственной копии той самой последовательности, переданной заранее. Перед сеансом связи отправитель и получатель вскрывают припасенный блокнот с кодами, используют нужную страницу, а после использования обязательно ее уничтожают.

В 1940-х годах было математически доказано, что такой “одноразовый блокнот” является единственным абсолютно невзламываемым кодом. Конечно, ключевой поток при этом должен быть истинно случайным и известным только отправителю и получателю. И использовать его можно лишь однократно.

Опасности, вызванные нарушением этих правил, проявились во время “холодной войны”, когда американские дешифровщики обнаружили ошибки советских шифровальщиков, использовавших одни и те же ключевые потоки. Это позволило прочесть перехваченные сообщения и раскрыть крупную сеть советских шпионов, в том числе высокопоставленных агентов в Белом доме и Великобритании.

Сегодня ученые считают, что абсолютно случайные одноразовые последовательности можно получать на основе субатомных процессов. В 2010 году группа из германского Института квантовой оптики общества Макса Планка объявила, что научилась генерировать одноразовые ключевые потоки, пользуясь непредсказуемостью окружающих нас квантовых флуктуаций. Такие ключевые потоки истинно случайны и совершенно уникальны, так что их невозможно воспроизвести вновь. На них строится абсолютно невзламываемая система шифрования.

? Как выбрать кратчайшую очередь

Попадание в пробку - тот случай, когда случайность разрушает наши планы. Если на загруженном шоссе всего один автомобиль неожиданно резко затормозит, это порождает “джамитон” - волну уплотненного трафика, идущую навстречу движению со скоростью около 15 км/ч и вызывающую пробки, а с ними и недоумение и раздраженность водителей.

Случайность может создать проблему в очереди, даже если все ведут себя корректно. С одной стороны, кажется, что кассирам в супермаркете достаточно обслуживать людей с той же скоростью, с какой те заходят в магазин. Но с другой, - математика случайности показывает, что если люди не обслуживаются быстрее, чем они приходят, очередь растет до бесконечности.

Как избежать нервотрепки при попадании в самую медленную очередь? Предсказать что-либо тут невозможно. У каждой кассы возникает свой набор случайных задержек, а значит, в двух случаях из трех очередь, в которой вы стоите, отстанет от одной из двух соседних. Чтобы меньше волноваться, при прочих равных выбирайте очередь у крайней кассы: с ней, по крайней мере, соседствует лишь одна очередь, что увеличивает ваши шансы прийти первым до 50%.

? Моделирование будущего

Китайцы говорят, что предсказывать трудно, особенно будущее. Однако есть метод, помогающий в решении этой задачи. Забавно, что основан он как раз на случайности. В 1940-х годах метод Монте-Карло изобрел поправлявшийся в госпитале польский математик Станислав Улам (Stanislaw Ulam), пытавшийся предсказать исход карточных игр. Ему в голову пришла идея использования счетной машины для воспроизведения большого числа партий. Это позволяет разобраться, какие исходы наиболее вероятны. Метод получил название в честь места, где случайность правит бал, - казино Монте-Карло, а первые его применения связаны с созданием водородной бомбы. Сегодня метод Монте-Карло широко используется для моделирования множества вероятностных событий. Например, команды “Формулы-1” отыскивают наилучшие пути стратегии путем анализа большого количества гонок. В каждом прогоне немного меняются вероятности наилучших событий - от замены шин до успешного обгона.

? Как тасовать колоду карт

Невозможно оторвать взгляд от зрелища, когда заядлый картежник тасует колоду карт: он быстро пролистывает их края, заставляя карты чередоваться. Однако итог тасовки врезкой часто не столь уж впечатляющ и далек от случайного. Фактически после семикратного повторения карты вполне могут лечь в исходном порядке. Этим способом перемешивать колоду могут пользоваться шулеры, чтобы не сдвигать с места подготовленные для шулерства карты.

Забавно, что самый эффективный способ перетасовать колоду столь прост, что с ним справится даже двухлетний ребенок. Он называется “мытьем колоды” и состоит в сваливании всех карт в кучу на столе с последующими круговыми перемешивающими движениями обеими руками. Это выглядит не так эффектно, зато хорошо работает.

? Испытание лекарств с помощью случая

Когда появляется новый метод лечения, есть лишь один способ доказать его эффективность - испытав на людях. Однако испытатели могут быть введены в заблуждение из-за влияния неучтенных факторов. Чтобы их исключить, ученые-медики применяют так называемые рандомизированные клинические исследования. Пациентов разделяют на две группы: одна получает новое лечение, а дргуая - старое (или безвредное плацебо). Тут принципиально то, что распределение по группам производится случайным образом - для уверенности, что в каждую группу попала одинаковая доля пациентов, которым станет лучше или хуже по неизвестным причинам, не связанным с лечением. Тогда разные результаты, наблюдаемые в двух группах, можно приписать единственному фактору, по которому они различаются - применению нового метода лечения.

? Фантомный порядок

Среди уловок случайности нет более опасной, чем способность дурачить нас, заставляя видеть вещи, которых попросту не существует. Впрочем, виноваты в этом мы сами, люди, так как развили в себе удивительные способности замечать закономерности даже там, где их нет. Явление, называемое апофенией, приводит к тому, что человек видит изображение Христа на свежеподжаренном тосте или лица инопланетян на фотографиях Марса. Но не менее важна и другая малоизвестная черта случайности: ее способность приводить к кластеризации. Представьте себе город, в котором в среднем происходит 12 убийств в год. Если за месяц вдруг случится три убийства, - втрое больше ожидаемого числа, - легко поверить, что в городе появился серийный маньяк. Однако законы случайности говорят, что такая кластеризация весьма вероятна; в действительности, строго по одному убийству каждый месяц произойдет лишь раз в 19 тыс. лет. В абсолютном же большинстве случаев в одни месяцы случится по крайней мере пара убийств, а в другие их не будет вообще. Эта кластеризация случайных событий стоит за множеством страшных историй - от эпидемий загадочных самоубийств до так называемых “раковых зон”. Иногда объяснение сводится к обычной теории вероятности. Например, в 1980 году более 20 работников крупного оборонного подрядчика в Великобритании совершили суицид или погибли от насилия, что вызвало серьезные подозрения и колоссальный скандал. Но любители теорий заговора не обратили внимания на то, что в штате подрядчика числятся десятки тысяч сотрудников, что делает всплески “необычных” смертей статистически неизбежными.

Иногда кластеризацию нельзя списать только на случайность. Один такой случай проявился в очень высокой частоте редкого типа рака - мезотелиомы, отмеченной в 1960-х годах среди рабочих фабрики, выпускавшей огнеупорные материалы. При детальном расследовании этого кластера выяснилось, что причиной является асбест. С тех пор он был запрещен.

Отличить настоящий кластер от того, что порожден случайностью, непросто. Эпидемиологи сравнивают число событий в подозрительном кластере с тем числом, которое ожидалось бы для такой же выборки людей с тем же возрастом, образом жизни и другими характеристиками. Если расхождение между наблюдаемым и ожидаемым числом случаев слишком велико для случайной флуктуации, стоит начать поиск вероятных причин.

Большинство таких кластеров совершенно точно являются флуктуациями, подтверждая тем самым склонность случайности к розыгрышам. К счастью, не все из них неприятные, о чем говорит так называемый парадокс дня рождения. Согласно его формулировке, в группе всего из 23 случайно выбранных людей с высокой вероятностью (более 50%) хотя бы у двоих будет совпадать день рождения. Большинству трудно в это поверить, но это так. Объяснение этого факта состоит в том, что даже из такой небольшой группы, как коллектив из 23 человек, можно составить пары людей 253 способами. Такое их количество дает большой простор для случайных совпадений.

? Случайный шум помогает услышать

Добавление определенного уровня случайного шума парадоксальным образом помогает расслышать слабые сигналы. Хитрость заключается в стохастическом резонансе, когда случайный шум приподнимает громкость сигнала выше порогового уровня обнаружения. Это напоминает переворачивание блинов на сковородке: при слишком малом усилии блин не поднимется достаточно высоко, чтобы перевернуться; а при слишком большом - упадет на пол. Строго рассчитанное усилие поднимает блин ровно настолько, чтобы выполнить идеальное сальто.

Стохастический резонанс может помочь людям с ослабленным слухом: подавая случайный шум на имплантат в улитке уха, можно за счет стохастического резонанса значительно повысить чувствительность устройства.

? Как трудно поймать случайность

Генерация случайных чисел оказалась сложной задачей. Дело в том, что такие числа должны быть совершенно не связаны друг с другом и при этом не тяготеть ни к какому конкретному множеству чисел. Скажем, бесполезно просить людей выписывать случайные цифры от 0 до 9: исследования профессора психологии Нормана Гинзбурга (Norman Ginsburg) из университета Макмастера в Канаде показали, что многие люди думают, что “случайные” означают “равномерно распределенные” и выдают мало цепочек повторяющихся или последовательно идущих цифр. Истинная случайность гораздо более подвержена кластеризации, чем кажется людям: например, почти в половине тиражей национальных лотерей выпадает хотя бы пара последовательных номеров.

Для получения рядов чисел, похожих на случайные, выведены специальные математические формулы, но у них есть свои недостатки. В 1970-х годах ученые обнаружили, что одна из формул, применяемых в компьютерах и известная как RANDU, дает небольшое систематическое отклонение. Это поставило под вопрос итоги исследований, использовавших RANDU для получения наборов случайных чисел.

Прорыв в генерации истинно случайных чисел произошел в 1949 году, когда Алан Тьюринг (Alan Turing) показал, как можно использовать электрические цепи для получения абсолютно случайных флуктуаций, вызванных тепловым движением электронов. В 1955 году корпорация RAND в Калифорнии опубликовала самую скучную в мире книгу - “Миллион случайных цифр со стандартным отклонением 100000”. Весь ее текст - это пятизначные случайные числа, сгенерированных устройством, имеющим особую электрическую цепь, поедверженную случайным флуктуациям. Книга была востребована учеными, которые нуждались в надежном источнике случайных чисел для таких задач, как, например, проведение рандомизированных клинических исследований.

Электронная случайность используется и сегодня. Ernie (Electronic Random Number Indicator Equipment) служит для генерации номеров в лотерее Premium Bond.

“Псевдослучайные” ряды, генерируемые компьютерами, вполне хороши для повседневных целей, - например, для интернет-лотерей. Но тем, кто в них играет, лучше использовать опцию “мне повезет” (“lucky dip”), - выдаваемый по ней случайный набор номеров минимизирует вероятность того, что большим выигрышем придется делиться с миллионами тех, кто по незнанию выбирает более упорядоченные наборы чисел.

Источник: «Наука в фокусе»