?

Log in

No account? Create an account
…и не чёрная. У нас полоса с надписью: «Crime scene! Do not cross!»

Охота на нолики

Коллеги kobak, podmoskovnik и oude_rus изучили динамику доли целочисленных процентов на федеральных выборах. Идея – правильная и давно витающая в воздухе. И раз она уже дошла до стадии публикаций, поделюсь и своими мыслями на этот счёт.
Как мне представляется, избирательные участки, где фальсификаторы рисуют круглые числа (целые проценты являются круглыми числами в терминах промилле), надо считать не по стране, а по субъектам федерации, иначе тотальная склонность Поволжья и Северного Кавказа к этому типу фальсификаций замазывает общую картину.

Я рассматриваю следующие 3 электоральные характеристики: количество избирателей, принявших участие в выборах (получивших избирательные бюллетени); явку избирателей – долю зарегистрированных избирателей, принявших участие в выборах; результат власти – долю избирателей, поддержавших кандидата/партию власти, измеряемая от числа принявших участие в голосовании (опустивших бюллетень в урну). Две последние величины, являющиеся дробями, при анализе превращались в целые числа путем умножения на 1000 и округлением до ближайшего целого. Чтобы гарантировать значительную ширину разброса для количества принявших участие выборах и по возможности исключить дроби с малыми знаменателями для явки и результата, учитываются только те участки, на которых участие в выборах приняли более 100 человек. Кроме того, для явки исключаются участки, где в выборах приняли участие все без исключения зарегистрированные избиратели (это может быть следствием отсутствия заранее составленных списков избирателей, что делает явку фиктивной величиной).

Первый, примитивный, анализ направлен на рассмотрение доли субъектов федерации, где доминируют круглые числа для участия в выборах или промилле явки либо результата власти.

Сразу обращает на себя внимание, что хотя, как продемонстрировали коллеги, по интегральному использованию этого метода фальсификаций для явки 2016 и 2018 гг. превзошли 2008 г., по его распространённости мы ещё не достигли былого великолепия. Почти вся туфта сконцентрирована в 2 федеральных округах.

Сама по себе констатация преобладания круглых чисел не очень информативна, т.к. их может быть лишь чуть больше нормы. Поэтому я ввожу количественную меру. Регистрация на участке круглого значения электоральной характеристики представляется собой испытание Бернулли с вероятностью успеха 0,1. Легко посчитать вероятность того, что число успехов на выборке из рассматриваемых участков субъекта превысит определённое число. Ситуация, когда вероятность получить наблюдаемое (или большее его) число успехов оказывается ниже 1/100 (в РФ чуть менее 100 субъектов), считается подозрительной.


Здесь уже видно, что участие в выборах хоть и рисуется круглым наиболее часто (предыдущий график), но сильно не концентрируется по субъектам.
По круглым промилле явки мы пока не вышли на уровень 2008 г., хотя и впрямь близки к нему.

Наконец, зная вероятность того, что в субъекте имели место фальсификации определённого типа, можно оценить их интегральный эффект для страны в целом, если суммировать результаты по субъектам с весами, равными минимуму из вероятностей, рассчитанных для 3 рассматриваемых электоральных характеристик. Это даёт более истинные проценты явки и результата власти, распространение которых на всю страну, позволяет оценить эффект от фальсификаций рассматриваемого типа. Конечно, этот метод – кое в чём варварский, но общую картину он передаёт верно.

Как можно видеть, в 2018 г. рисование круглых чисел дало меньше липовых голосов, чем в 2016 г. Скорее всего, это связано с возросшим разнообразием фальсификаций (возврат физических вбросов и массовое открепление избирателей) и несколько улучшившимся общественным контролем за голосованием и подсчётом голосов.

Девиз царстования

Если мы не выстрелим себе в ногу, в неё выстрелят солдаты НАТО. (c)
Приведу пока картинки без комментариев.
Мне просто интересно, я один вижу здесь «что-то не то» в 2018 г.?









UPD: Явка за оппозицию – доля избирателей, проголосовавших за кого угодно, кроме кандидата/партии власти, или испортивших бюллетень.
Явка за оппозицию = Общая явка – Явка за власть
Этот метод – чисто алгоритмический. Как и в прошлом методе берётся зависимость доли недействительных бюллетеней (НДБ) от накопленной явки.
Далее итерируется диапазон её приемлемых значений по следующему алгоритму. Для текущего диапазона рассчитываются минимальное и максимальные доли НДБ. Исходя из их реального количества по этим долям вычисляются оценки минимального и максимального числа проголосовавших избирателей, на основе которых вычисляются новые границы диапазона явки. В качестве начальных значений явки взяты её верхняя и нижняя децили. При разбиении её диапазона на 200 точек процесс сходится за 2 итерации.
Результаты по доле НДБ и оценкам вброса даны в таблице.
ГодДоля НДБВброс
млн голосов% (от истин.)
20071,18%5,28,0%
20111,88%10,619,2%
20162,47%12,932,4%
20081,49%6,69,7%
20121,33%8,914,2%
20181,24%9,715,2%

Таким образом, хотя размеры вброса меньше для президентских выбором, чем для парламентских, в обоих случаях они растут от выборов к выборам. А вот доля НДБ растёт только для парламентских выборов, а для президентских снижается.

Охота на сгустки

Если при анализе равномерности распределения последней цифры целочисленных электоральных характеристик сменить систему счисления, то психологически притягательные нолики (целые проценты явки и результата) перестанут быть таковыми, а сгустки, т.е. концентрация на директивно заданных целевых показателях, никуда не денутся. Более того, если фальсификаторы в разных ТИК сосредотачиваются на разных целевых цифрах, то при смене системы счисления их сгустки могут наложиться.
Из ускользнувших ранее попались 2 субъекта федерации.
Из 137 всего участков Ингушетии для 35 участков результат кандидата власти лежит на отрезке [82,5%;82,7%], а для 40 – на чуть более широком [82,47%;82,74%], который отображается в первый при округлении до десятых процента.
А в Карачаево-Черкесии если взять основание системы счисления, равное 22, то за счёт наложения сгустков на 87,8% и на 90,0% получается –lgα ≈ 4,3. Учитывая перебор разных оснований, это – не очень много, но всё-таки…
Предмет анализа – распределение последних цифр основных целочисленных электоральных характеристик, значения которых выдумываются фальсификаторами: количества выданных бюллетеней, и умноженных на 1000 явки и результата кандидата власти (т.е. рассматриваются десятые доли процентов этих величин). У целочисленной случайной величины, разброс которых измеряется многими десятками и даже сотнями единиц, должны быть равновероятны. Это проверяется с помощью критерия Пирсона, позволяющего проверить гипотезу о естественном происхождении отклонений от равномерного распределения. Вероятность того, что эта гипотеза верна и отвергнута ошибочно задаётся её уровнем значимости α (подробное описание методики – тут).
Субъект–lgαВеличинаЦифра
Татарстан37,0Явка0
Дагестан35,5Явка0
Краснодарский кр.28,0Явка0
Башкортостан26,4Явка0
Кемеровская обл.17,8Явка0
Саратовская обл.8,0Явка0
Северная Осетия6,3Выдано0
Ставропольский кр.5,5Явка0
Крым4,4Выдано0
Тверская обл.3,4Выдано4
Карачаево-Черкесия2,9Явка0
Ростовская обл.2,9Явка0
Алтайский кр.2,6Выдано0
Тыва2,5Результат0
Хабаровский кр.2,5Выдано0
Ингушетия2,3Результат5
Липецкая обл.2,1Явка1
Чукотский авт.окр.2,1Выдано6
Мордовия1,7Результат0

Учитываются только участки, где выдано не менее 100 бюллетеней. Приводятся данные по электоральной характеристике с наименьшей значимостью гипотезы о случайном возникновении неравномерности последних цифр.
Для 86 (включая зарубежную территорию) субъектов и 3 электоральных характеристик должна в среднем 1 раз встретиться ситуация с –lgα = –lg3×86 ≈ 2,4. Всё, что меньше, можно считать естественным, что больше, следует считать подозрительным. Причём каждая единица увеличения –lgα означает десятикратное падение вероятности. Таким образом, Татарстан, Дагестан, Краснодарский кр., Башкортостан и Кемеровская обл. продемонстрировали запредельный уровень рисования, Саратовская обл., Северная Осетия и Ставропольский кр. – наглый, а Крым и Тверская обл. – умеренный.
Если учитывать субъекты с весами, равными α, то явка уменьшится с 67,5% до 64,1%, а результат кандидата власти – с 76,7% до 74,5%. Иначе говоря, тупое рисование цифр дает малый вклад в общий объём фальсификаций. Впрочем, так отлавливаются только случаи рисования психологически притягательных круглых или директивно заданных чисел. Последнее после саратовского случая стало нетипичным.
UPD: Обновил данные по состоянию на полдень 20.03. Кроме того, посмотрел, что будет если в качестве весов субъектов вместо минимума из трёх уровней значимости брать их произведение (опыт показывает, что в некоторых регионах в одних ТИК фальсифицируют явку, а в других – результат). При таком подсчёте явка уменьшается до 63,1%, результат кандидата власти – до 73,6%.

Оценка вброса

Если считать, что недействительные бюллетени (НДБ) не вбрасывают и поэтому с ростом общей явки их доля не должна меняться, то можно оценить вброс разбавляющих их действительных бюллетеней. Поскольку он увеличивает явку, при определении реальной доли НДБ наибольшего доверия заслуживают участки с сравнительно небольшой явкой. Однако именно для них наиболее существенна роль случайных факторов, в силу чего необходимо рассмотрение по возможности обширной выборки.

Удовлетворить одновременно обоим этим требованиям позволяет анализ кумулятивных характеристик доли НДБ, т.е. учитываются только участки с явкой, не превышающей некоторого порога. Его величина, определяемая из условий максимальной стационарности средней доли НДБ и минимальности его стандартного отклонения, составляет примерно 58÷68%. В этом диапазоне накопленной явки доля НДБ устанавливается на уровне в 1,237÷1,244%. С учетом их общего количества в 0,791 млн это позволяет ожидать 63,56÷63,92 млн проголосовавших. Однако по официальным данным проголосовало 73,53 млн чел., т.е. имеется излишек в 9,61÷9,97 млн бюллетеней, или 13,1÷13,6% от официального количества проголосовавших. Таким образом, истинная явка, составляющая 58,3÷58,7%, завышена на 8,8÷9,2% пункта. По меркам парламентских выборов это – немного.

UPD: Квантили условного распределения доли НДБ в зависимости от явки:

Обработка скользящем в окне 2500 участков.

[reposted post] Настоящий или не настоящий царь?



В последние несколько недель было написано много статей об оптимальной стратегии на президентских выборах. Я сам написал несколько постов по этому поводу (https://mmironov.livejournal.com/33762.html, https://mmironov.livejournal.com/34846.html, https://mmironov.livejournal.com/35317.html, https://mmironov.livejournal.com/35348.html, https://mmironov.livejournal.com/35594.html). Можно, конечно, продолжать дискуссию про количественные показатели: кто сколько наберет процентов, насколько снизится явка и т.д. Но, возможно, пора уже понять, что между различными стратегиями есть не только количественная, но и качественная разница. Выбор из одного из допущенных кандидатов – это, по сути, доказать, что царь – настоящий. Забастовка – это доказать, что царь ненастоящий.

Если вы идете на выборы, значит,признаете их легитимными. Следовательно, легитимен и победитель этих выборов. Мы все уже знаем (даже гугл), кто их выиграет. Многие апологеты этой стратегии говорят, что если в это верить и не бороться, то так и будет. Это так и будет, но не потому, что кто-то не хочет бороться или что-то делать, а потому, что кандидаты отобраны именно таким способом, чтобы никто из них не смог составить серьезную конкуренцию Путину. «Яблоко» Григория Явлинского уже много лет не может набрать на федеральных выборах больше 3%.  Да и сам Явлинский – авторитарный политик, не сильно отличающийся от Путина (https://mmironov.livejournal.com/8131.html). Был бы он демократом и хотел бы, чтобы его партия поборолась за победу, – устроил бы праймериз. Я уверен, что если бы на этих выборах выдвинули, например, Гудкова, то он бы мог претендовать на куда больший процент голосов.  У Ксении Собчак антирейтинг 80%, и у нее табу на критику Путина. К тому же вся ее кампания построена на окучивании небольшой ниши либерально-настроенного электората – Крымненаш, свобода – хорошо, несвобода – плохо и т.д. Это автоматически ограничивает ее результат несколькими процентами. Титов с момента выдвижения поет осанны Путину (Путин – человек скромный, хвастаться не любит, видимо, ему в гонке нужен участник, кто бы его постоянно хвалил). Ниша Жириновского стабильная, но постоянно снижается (2008 г. - 9.35%, 2012 г. – 6.22%). Кто такой Грудинин еще месяц назад не знали 99% населения. Да он и сам, похоже, не знал, что будет кандидатом. Никакой активной кампании, чтобы отобрать голоса у Путина он не ведет.

Как ни крути, в списке кандидатов нет ни одного, кто бы вел хоть какую-то борьбу за второй тур и мог бы набрать хотя бы 10%. Все хитроумные стратегии «давайте придем и испортим бюллетень», «давайте придем и проголосуем за одного из демократов» и другие работают только на 3% процента избирателей, которым не лень читать описание всех этих раскладов и действовать стратегически. Массовому избирателю нужно показать – вот есть такой-то кандидат, он лучше, чем Путин, и нужно прийти за него проголосовать. Проблема в том, что такого кандидата нет (они так были отобраны), поэтому Путин наберет свои 70%, просто потому, что остальные кандидаты еще хуже. Несмотря на то, что хитроумные стратегии сработают всего на 3% избирателей, их обсуждение заполнит 99% информационного пространства, неконтролируемого Кремлем. Ведь именно эти 3% меньшинства являются самыми активными читателями/писателями/вещателями всех независимых СМИ. В результате сложится ощущение, что демократы призывали всех прийти на выборы, проголосовать за их кандидата или уничтожить бюллетень, призывали всех не сидеть на диване, а обязательно прийти на участок, и… Путин набрал 70%. Потом будут оправдания про неравный доступ к агитации, но после драки кулаками не машут. Общество будет видеть простую и понятную картину – демократы из кожи вон лезли, пытались мобилизовать своих сторонников, понаставили наблюдателей, и все равно за них никто не голосует. А за Путина – голосуют, он набрал 70%. Именно так эта история будет подана госпропагандой и умело раскручена по всем федеральным каналам. В списке была куча кандидатов от разных партий, был даже «кандидат против всех», за которого проголосовало всего 2% избирателей. Значит, 98% в целом все в нашей стране устраивает. Значит, царь настоящий. Если вы призывали своих сторонников прийти и проголосовать, вы потом не можете говорить, что выборы изначально были фэйковые. Участвовали? Участвовали. Призывали своих сторонников проголосовать? Призывали. Ваших сторонников оказалось мало? Мало. У Путина сторонников оказалось много? Много. Ну и какие претензии???

«Забастовка избирателей», напротив, направлена на делегитимизацию текущих выборов президента как таковых. Она не признает саму эту процедуру переназначения Путина. Соответственно, победитель этих «выборов» не может быть настоящим царем просто потому, что сами выборы от начала до конца были ненастоящими. Именно поэтому власти так истерично реагируют на «забастовку избирателей». То, что Путин выиграет эти «выборы», сомнений нет ни у кого. Для властей важно, чтобы общество восприняло Путина как легитимного победителя. Первая стратегия направлена именно на это (поэтому всем зарегистрированным кандидатам не чинят особых препятствий в агитации, не создают административных барьеров при прохождении процедур, и т.д.), а вторая стратегия направлена как раз на то, чтобы убедить общество, что царь – ненастоящий (отсюда и погромы штабов «забастовки», и массовые аресты координаторов и волонтеров). Кстати, многие критики забастовки говорят, что эта агитация повлияет всего на несколько процентов либерально-настроенных избирателей и поэтому ни на что серьезно не повлияет. Это не так. Если бы это была настоящая цель – повлиять на 3% демократического электората, то не нужно было строить (а сейчас продолжать финансировать и поддерживать) разветвленную структуру в регионах. На 3% можно повлиять и через интернет. Онлайн ресурсы Навального достаточно популярны, чтобы достичь этой цели. Оффлайн инфраструктура нужна именно для того, чтобы проводить активную агитацию среди сторонников Путина, которые получают информацию не из интернета, а из других источников (газеты, федеральные каналы).  Это инфраструктура нужна как раз, чтобы донести основные идеи «забастовки» до массового избирателя. Именно поэтому власть ее так остервенело громит.

Митинги также являются важной частью стратегии, чтобы показать, что «царь ненастоящий». В авторитарном, запуганном обществе, когда каждый думает, что общество все целиком поддерживает диктатора, а если он думает иначе, то это, скорее, он какой-то не такой, очень важно показывать публичные знаки недовольства. Вспомните сказку «Голый король». Система перешла в качественно иное состояние, когда один мальчик громко крикнул: «А король-то голый!». Было важно, чтобы кто-то громко заявил очевидное, и тогда к этому высказыванию стали присоединяться все больше и больше людей. Митинги – это попытки активной части общества громко крикнуть: «Царь ненастоящий, он боится конкурентных выборов!». Даже если в таких митингах будет участвовать всего полпроцента населения, это достаточно заметно, чтобы еще несколько десятков процентов населения задумались и попытались изучить подробно аргументы тех, кто протестует.

Здесь, конечно, каждый решает за себя.  Правда, нужно понимать, что стратегия «царь – настоящий» - это путь в никуда. Рассчитывать, что милостивый царь, в благодарность за правильное поведение на выборах даст нам какие-то свободы – наивно. Максимум, партии-участники, преодолевшие 3%, получат госфинансирование, или какой-то из них на следующих выборах разрешат пройти в Госдуму. Стратегия «царь – ненастоящий» - рискованная, но и потенциальные  выгоды от нее намного больше. Если Путин будет чувствовать, что значительная часть общества не признает его легитимность, то ему придется идти на какие-то уступки обществу (как было после протестов 2011-2012). Насколько эти уступки будут значительными – зависит от размера проявленного недовольства и его продолжительности. Как это ни пафосно звучит – все зависит от нас.
 




Поговаривают, что в СМИ сейчас страшно мочат Павла Грудинина. Значит ли это, что он и сам страшен?
Грудинин, баллотировавшийся на парламентских выборах 2016 г. по Люберецкому (121) одномандатному округу МО, проиграл представительнице партии власти. Результаты выборов, разумеется, были фальсифицированы. Однако их реконструкция позволяет составить представления о популярности Грудинина в округе, где его каждая собака знает.
Напомню методику реконструкции. При рассмотрении явки за оппозицию (все кандидаты, кроме кандидата власти, включая испорченные бюллетени) в зависимости от общей явки фальсификации смещают участки вправо и/или вниз от истинной зависимости. В предположении её линейности участки можно разделить на достоверные и недостоверные. В силу определённой субъективности, присущей такому делению, вводится промежуточная градация подозрительных участков.

Официальный результат кандидатки власти составил 49,1%, а Грудинина – 13,1%. Если исключить из рассмотрения недостоверные участки, то первая величина уменьшится до 36,9%, а вторая – возрастает до 16,5%. Если же исключить и подозрительные участки, то получатся соответственно цифры 35,2% и 16,8%. Таким образом, реконструкция результатов выборов даже по самому жёсткому варианту не дает победы Грудинину, отставание которого от фаворитки всё ещё составляет 18,4% пунктов.
Однако фальсификации выборов не ограничиваются фальсификацией их результатов, затрагивая также и саму их процедуру. Из-за разных возможностей предвыборной агитации кандидаты оказываются в неравных условиях, что приводит к отклонению зависимости между общей и частными явками от прямой пропорциональности.
Приведённая на картинке аппроксимационная прямая пересекает ось абсцисс в точке 13,1%, а ось ординат в точке −11,6%. Первая величина характеризует долю избирателей–зомби, голосующих за власть даже в той гипотетической ситуации, когда больше никто вообще ни за кого не голосует. Вторая величина характеризует масштаб (стихийной) забастовки избирателей – это доля тех из них, кто не пошёл голосовать, не найдя «своего» кандидата или не узнав о нём.
Цифры показывают, что даже если бы все зомби остались бы дома или если бы все забастовавшие избиратели пришли голосовать и поддержали Грудина, ему бы этого не хватило для прохождения в Думу. Никаких оснований полагать, что его электоральные позиции сейчас на федеральном уровне сильнее, чем были тогда на региональном. Это позволяет поставить Пашу в один ряд с другими «плюшевыми» кандидатами (Ксюшей, Гришей, Борюшей) и забыть его фамилию.