Как и сколько в Перми «нарисовали» голосов на голосовании по поправкам к Конституции РФ |
||
МЕНЮ Искусственный интеллект Поиск Регистрация на сайте Помощь проекту ТЕМЫ Новости ИИ Искусственный интеллект Разработка ИИГолосовой помощник Городские сумасшедшие ИИ в медицине ИИ проекты Искусственные нейросети Слежка за людьми Угроза ИИ ИИ теория Внедрение ИИКомпьютерные науки Машинное обуч. (Ошибки) Машинное обучение Машинный перевод Нейронные сети начинающим Реализация ИИ Реализация нейросетей Создание беспилотных авто Трезво про ИИ Философия ИИ Big data Работа разума и сознаниеМодель мозгаРобототехника, БПЛАТрансгуманизмОбработка текстаТеория эволюцииДополненная реальностьЖелезоКиберугрозыНаучный мирИТ индустрияРазработка ПОТеория информацииМатематикаЦифровая экономика
Генетические алгоритмы Капсульные нейросети Основы нейронных сетей Распознавание лиц Распознавание образов Распознавание речи Техническое зрение Чат-боты Авторизация |
2020-07-06 06:01 Основы исследования Разведочный анализ данных (exploratory data analysis) и математические методы применительно к большим массивам данных, собранным по итогам избирательных кампаний, позволяют показать, насколько большой масштаб фальсификаций произвели власти на выборах. Впервые такие методы в России начали использоваться в 90-ые, но полномасштабно лишь в середине нулевых. Самым известным исследователем статистики российских выборов, начиная с того периода, является физик Сергей Шпилькин. Основой анализа для таких исследований являются официальные данные. Это огромный массив многомерных числовых данных по сотне тысяч избирательных участков, собранный на сайте Избиркома, и множество сопутствующей информации за период с 2003 года: динамика явки, адреса и координаты участков, привязка адресов к участкам, наличие/отсутствие КОИБ, видеокамеры, составы избирательных комиссий и т. д. Вкупе с работой наблюдателей все эти данные вместе складываются в цельную картину, которая позволяет более или менее точно описать честность прошедших выборов. Многомерность данных затрудняет фальсификации. Каждая единица данных вписана в территориальное окружение, историю прошлых голосований, динамику по времени голосования, параллельные выборы и т. п. Поэтому «наивные» манипуляции с данными трудно скрыть. Чем реальные данные отличаются от подделки? Реальные результаты голосования складываются в результате действий множества отдельных избирателей: сотен и тысяч человек для каждого избирательного участка. Все эти действия складываются в случайную и одновременно закономерную, очень сложную картину. Реальные данные имеют естественный статистический разброс и естественное распределение, они зависят от обнаружимых и объяснимых факторов. Фальсифицированные результаты складываются в результате действий небольшого числа лиц, единичны для каждого избирательного участка и часто выбиваются из общей картины. Фальсификация результатов происходит на самом нижнем уровне, в участковых избирательных комиссиях, и сразу заносится в систему «ГАС Выборы», то есть сразу становится отчётностью. Таким образом, фальсификаторы не могут увидеть своё место в общей картине в момент внесения данных и сразу выдают себя. В России анализ информации независимыми специалистами производится по итогам голосования на участковых избирательных комиссиях (УИКах). Плюс такого метода в том, что их много, более 97 тыс. в стране (ТИКов же в России около 2770-ти), это большой массив данных, и их можно разбивать на нужные подмассивы, которые, с точки зрения статистики, тоже будут адекватного для анализа размера. А на небольшом числе элементов, меньше тысячи, статистика перестаёт работать осмысленно. Кроме того, это единственный уровень, на котором фальсифицированные и нефальсифицированные данные не смешаны между собой. В Пермском крае проживает 1 982 980 избирателей. В ходе общероссийского голосования избирателям было выдано 1 040 935 бюллетеней. Таким образом, явка по краю составила 52 %. За поправки проголосовало 70,75 % (734802 избирателей). Против проголосовало 28,27 % (293643 избирателей), испортили бюллетень 10 129 избирателей. Всего на территории края находится 1787 участковых избирательных комиссий (УИКов). Визуализация данных. Диаграмма рассеяния Для понятной визуализации результатов выборов по Пермскому краю создаём простую картинку На честных выборах результаты на диаграмме рассеяния собираются на графике в однородные компактные облака (кучки). При нечестных выборах, со вбросами и рисовкой, результаты сильно растягиваются вправо и формируют растянутое широкое пятно. Вот примеры: Теперь давайте сравним два региона РФ, по разному проголосовавшие по поправкам в Конституцию. Красные точки Перейдём наконец к Пермскому краю. Диаграмма рассеивания в Пермском крае приведена в сравнении с другим регионом, проголосовавшим относительно честно Из графика видно, что результат в Пермском крае не собран в одно компактное облако, как в Карелии. Чем выше явка на участке, тем больше голосов появляется «За», и всё сильнее убывает число голосов «Против». Это является одним из основным маркеров фальсификаций. Изредка при фальсификациях данные ужимаются в очень плотной точке (как на голосовании в Казани), либо вытягиваются в одну очень ровную линию, что мы тоже можем увидеть у Пермского края по общероссийскому голосованию на отметке 71,9 % голосов «За»: Кривые Шпилькина Для выявления фальсификаций мы можем использовать и другой способ: гистограмму явки. Используя те же данные, мы составляем по каждому УИКу график зависимости количества итоговых голосов от явки. В итоге мы видим результаты каждого кандидата в зависимости от явки, в форме «колокола» или «горки». Чем больше голосов за кандидата, тем «горка» оказывается выше. Так, на графике ниже можно увидеть, что в 2012 на выборах Президента РФ Путин в Москве при явке в 58 % получил 215000 голосов. В России такие «горки» («колокола») называют «кривые Гаусса» либо «кривые Шпилькина», по имени Сергея Шпилькина, который стал самым известным экспертом, использующим такие графики. Кривые Гаусса на основе больших данных выстраиваются в форме «колокола» («горки») на основании законов математики и статистики, в частности, центральной предельной теоремы теории вероятности. Если «колокол» не нарисовался, мы можем сделать вывод, что с исходными данными (в нашем случае голосованием) что-то не так. Иногда на это могут влиять естественные факторы, которые отклоняют график от средних значений. Но чаще всего это административный ресурс и фальсификации. Вот пример кривых Гаусса на честных выборах (разные цвета кривых А вот искажение кривых Гаусса на нечестных выборах. Зеленая кривая показывает результаты «Единой России», красная кривая результаты КПРФ, и т. д. С каждыми новыми выборами в Госдуму России у «колокола» («горки») был всё более заметен хвостик фальсификаций, нарушающий естественную колоколообразную форму кривой Гаусса. Заодно справа от каждого графика с кривыми Гаусса указана диаграмма рассеяния, составленная на основе тех же данным. По сути, «хвост», появляющийся у колокола Гаусса (выделен штриховкой) на левом графике, аналогичен «хвосту», появляющемуся на правом графике на диаграмме рассеяния справа от эллипса максимальной плотности точек. На общероссийском голосовании по «обнулению» 1 июля фальсификации приобрели невиданный ранее масштаб. По оценке Сергея Шпилькина, было «нарисовано около 22,3 млн голосов, то есть в два раза больше, чем прошлые рекорды рисовки». Все данные по России разложились на две не связанных между собою группы (кластера). В одном кластере сосредоточена «стандартная» явка около 40 %, где поправки в Конституцию поддержало около 65 %. Это более-менее реальные данные. И есть другой кластер участков, где явка аномально высока, от 60 % до 100 % при поддержке поправок в Конституцию от 70 % до 100 %. Совокупность имеющихся данных говорит нам о том, что второй кластер Разделение данных на два кластера сформировало на графике явки не один стандартный «идеальный» колокол, а два колоколообразных горба, где левый горб Данные подтверждают и то, что явка в первые 6 дней голосования до 1 июля была нагонной и административной, которая в основном голосовала «За» поправки. Пермский край В Пермском крае на гистограмме явки (слева) вместо колоколов Гаусса сформировались похожие на федеральный график два горба, а на диаграмме рассеяния (справа) то, что должно быть компактным облаком результатов бессовестно растягивается вправо. К сожалению, на таком большом количестве УИКов Пермского края при таком вытянутом облаке, когда фальсификации могут быть более чем на половине от всех УИКов, метод выделения центрального кластера не работает. И мы не можем достоверно определить, какая доля избирателей после 52 % явки является рисованными бюллетенямии. Чтобы понять, на каких участках в реальности людей не было, и в них нужное число бюллетеней просто вбросили, данные Пермского края нужно вручную разбирать по каждому муниципальному образованию. Особенно безобразно график голосования на «референдуме» на территории Пермского края выглядит, если сравнить его с графиками прошлых выборов в Пермском крае. Теперь сравните прошлые выборы с нынешней гистограммой явки на референдум 1 июля: Гипотеза о том, что правый «горб» сформировался из-за более высокой, «нагонной» явки для голосования на крупных предприятиях Пермского края вроде «Ависмы», «Уралкалия» и «Сибура», скорее всего не подтверждается. Так как такая нагонная явка происходила на всех последних выборах. Тем не менее, колоколообразная форма кривой Гаусса на прошлых выборах в Пермском крае в основном соблюдалась. Ничего похожего на текущую «двугорбость» ранее в крае не наблюдалось. Косвенные признаки также указывают на нечистоту данных по Пермскому краю. В частности, соотношение всех голосов «Да» ко всем голосам «Нет» с повышением явки должно идти равномерно, по одной линии, как в прошлые годы, однако этого не происходит. С повышением явки доля голосов «Да» к голосам «Нет» непропорционально сильно растёт. Сергей Шпилькин отметил, что на графике выше «интересен провал перед 90 % А вот сравнение диаграмм рассеяния результатов в Пермском крае за прошлые годы и диаграммы рассеяния этого голосования. Как мы видим, компактная форма облака точек соблюдалась до 2016 года, в 2017 на выборах Решетникова заметно вытянулась вправо, а в 2020 больше половины УИКов совсем оттянулись в правую половину графика, сигнализируя о том, что результаты на 50 % УИКах Пермского края вызывают сомнения. Пермь В столице края картинка гораздо более занятная. В Перми проголосовало 361 857 избирателей, то есть более трети от всех проголосовавших в крае, и на уровне города, в отличие от уровня края, можно выделить центральный кластер, где сосредоточена бОльшая часть избирателей, и относительно небольшой аномальный «хвост», в котором, в частности, сильно выделяется ровная линия избиркомов, нарисовавших голоса «За» на уровне 71,9 %. Те же данные по Перми, но с кривыми Гаусса на гистограмме явки слева. Кривые Гаусса так же, как на федеральном и региональном уровне, образуют не один «колокол», а два «горба», но в Перми правый горб по крайней мере не такой значительный как во всей России, и понятно, что настоящее голосование сосредоточено именно в левом, более высоком «горбе». А правый горб во многом формируется из УИКов, расположенных по одной линии на уровне 71,9 «За». Далее мы отделяем диагональной линией все УИКи Перми с аномальной явкой и голосованием «За», чтобы примерно посчитать, результатам каких избиркомов в городе Перми нельзя доверять, а каким можно: Таким образом, из 422 пермских избиркомов не заслуживающими доверия оказывается примерно треть Отдельно оставляем на графике УИКи, расположенные ровно по одной линии на отметке 71,9 % голосов «За» и 28,1 % голосов «Против». Вот как УИКи, расположенные на одной линии, выглядят не на графике, а в числовом формате, округлённые до одной цифры после запятой. Математическая вероятность такого совпадения чисел на выборке из 422 элементов крайне, микроскопически мала. Отдельным маркером фальсификаций на этих участках служит 0 недействительных (испорченных) бюллетеней, что сразу выделяет их среди всех остальных участков города. Ещё одно маловероятное событие из мира статистики в Перми. Вероятность того, что все результаты на УИКах, расположенных по одной линии, сфальсифицированы Итоги 1. Так как многие УИКи на территории Пермского края (не только в Перми) «рисовали» результаты по одной линии на уровне 72 % «За» и 28 % «Против» при явке от 50 % до 80 %, можно сделать вывод, что такие показатели были спущены как целевые федеральным руководством. И на них многие избиркомы ориентировались настолько усердно, что просто «нарисовали» их без учёта реальных результатов на участке. Стоит отметить, что целевые результаты добиться удалось (70 % «За» при явке 52 %). 2. Более-менее реальными результатами по Пермскому краю нам кажутся 65 % проголосовавших «За» при явке около 40 %. Это практически те же показатели, что Сергей Шпилькин определил как реальные результаты для федерального голосования. По всей видимости, чтобы добиться в Пермском крае показателя явки хотя бы в 50 %, фальсификаторам пришлось усердно «рисовать» явку на участках, параллельно фальсифицируя б?льший процент голосов «За». Это дало дополнительный «колокол» кривой Гаусса на уровне 65 % явки, которого никогда не появлялось на прошлых выборах в Пермском крае, и сдвинуло более половины точек на диаграмме рассеяния вправо и вверх, сильно размазав обычно компактное на прошлых выборах в Пермском крае облако результатов. 3. В 41 избирательной комиссии (это более 40 тысяч проголосовавших) города Перми, почти со стропроцентной вероятностью можно утверждать, что были сфальсифицированы результаты на одинаковых показателях 71,9 % голосов «За» и 28,1 % голосов «Против» при нуле (!) недействительных бюллетеней. Такие показатели могут быть получены только при полной рисовке. Мы считаем, что замешанные в фальсификациях на этих УИКах должны быть отстранены от работы в избирательных комиссиях, и в отношении них должна быть проведена проверка на предмет совершения преступления, предусмотренного статьей 141 УК РФ. Вот список данных УИКов: 4. Ещё на 110 УИКах Перми (это 120 тысяч проголосовавших или 34 % от общего числа по городу) результаты были сфальсифицированы с некоторой долей вероятности. Результаты на них должны быть дополнительно проверены экспертами в исследовании электоральной статистики, а независимыми кандидатами на них к следующим выборам должны быть усилены меры наблюдения. *** Авторы выражают благодарность за помощь в написании статьи Григорию Шерстюку, Виталию Ковину и Сергею Шпилькину. Источник: zvzda.ru Комментарии: |
|