?

Log in

No account? Create an account

Previous Entry | Next Entry

В ходе возни с результатами российских выборов мне окончательно разонравились методы, опирающиеся на нулевую гипотезу о независимости относительного результата от явки. Фундаментальной проблемой этой гипотезы является то, что даже в тех случаях, когда она, возможно, выполняется, на практике её невозможно проверить, поскольку наблюдаемые отклонения от неё могут быть обусловлены не только субъективными (фальсификации), но объективными (структура электората) факторами, неразличимыми в рамках однопараметрической гипотезы.
Например, если в городе явка и поддержка власти низкие, а на селе – высокие, то в целом результат власти будет нарастать с явкой. Однако такая их честная корреляция, вызванная социальной неоднородностью населения, неизбежно будет списана на фальсификации. Чтобы избежать таких ошибок для проверки и реконструкции следует выбирать регионы, достаточно маленькие, чтобы можно было быть уверенным в их преимущественной однородности, но вместе с тем достаточно большие, чтобы давать поддающуюся анализу выборку. Некоторые субъекты федерации заведомо не удовлетворяют первому условию, а территориальные избирательные комиссии – второму. Оптимальным размером обладают избирательные округа (их средний размер в 2016 г. составил 0,43(16) тыс. участков, на которых было зарегистрировано в среднем 0,5(1) млн избирателей).
Другим объективным фактором, приводящим к отклонению от тривиальной нулевой гипотезы, является, как будет показано далее, существование избирателей-зомби, которые поддерживают власть вне зависимости от активности и симпатий остальной части электората. Простейшее предположении, что зомби составляют некоторую часть электората, специфичную для каждого региона, имеет следствием не постоянство, убывание относительного результата власти по мере роста явки за счёт растворения зомби в массе более живых избирателей.
Разделение электората на две части и эффективный учёт остаточной неоднородности предполагает использование двухпараметрической нулевой гипотезы. Наиболее удобным её видом представляется предположение о линейной связи между явкой и антирезультатом власти (абсолютным результатом оппозиции). Гипотетическая прямая имеет положительный наклон, но не обязана проходить через начала координат, отсекая на оси абсцисс долю избирателей-зомби.
Существует два принципиальных способа фальсификаций результатов выборов – вброс голосов за власть (жульничество) и переброс их от оппозиции (воровство). Произвольное рисование цифр является лишь комбинацией этих способов, однако думать о них лучше по отдельности. Вброс голосов увеличивает явку, но не меняет антирезультата, переброс, наоборот, не меняете явки, но уменьшает антирезультат. Таким образом, в координатах явка–антирезультат фальсификации сдвигают точки в одну сторону от честной прямой (вправо и/или вниз). Участки округа, принадлежащие к её ближайшей окрестности считаются достоверными, а отстающие от неё далеко, – недостоверными. Квалификация участков проводится вручную, исходя из представлений о прекрасном, но со следующим формальным ограничением. Если какой-то участок признан достоверным (недостоверным), то достоверными (недостоверными) принудительно признаются и все участки, отклоняющиеся от текущего положения регрессионной прямой меньше (больше), чем он. Точки лежащие слева и сверху от прямой имеют отрицательное отклонение и автоматически считаются достоверными, независимо от абсолютной величины расстояния. Изменение списка достоверных участков может привести к смещению регрессионной прямой, поэтому подвергшийся переквалификации участок перебрасывается туда-сюда до тех пор, пока её положение не установится.
Подразделение участков на достоверные и недостоверные может быть неоднозначным, поэтому пробуются его различные варианты. При этом вводится промежуточная квалификация для участков, хотя бы по разу попадавшие как в доверенные, так и в недостоверные. Они считаются подозрительными. Впоследствии отнесение подозрительных участков к достоверным или к недостоверным даёт верхнюю и нижнюю оценку объёмов фальсификаций.
Дополнительным преимуществом использования такого представления данных является то, что числа по обеим осям измеряются в одних и тех же единицах (процентах от списочного состава избирателей), что позволяет использовать регрессию Деминга (минимизация суммы квадратов отклонений в направлении, перпендикулярном к регрессионной прямой, а не по ординате, как делается для обычных регрессий), не задумываясь, какую из переменных считать объясняющей, а какую – объясняемой (обычный регрессионный анализ требует отсутствия погрешности у объясняющей переменной, что в данном случае невыполнимо). Практика показывает, что среднеквадратичный разброс достоверных участков вокруг регрессивной прямой обыкновенно лежит в диапазона 0,6÷1,1%, что находится в разумном согласии со средней численностью избирательных участков около 1 тыс. чел.
Наконец, если проведение осмысленной прямой оказывается невозможным, результаты выбора во всём округ следует считать полностью фальсифицированным, не изобретая специальных методов отлова массовых фальсификаций. Однопараметрическая нулевая гипотеза ни в постановке Собянина–Суховольского, ни в постанове Шпилькина такой возможности не предоставляет. Разумеется, сказанное не означает, что не следует проверять регионы на общую достоверность с помощью альтернативных критериев (распределение последних цифр, разброс внутри территорий, сгустки, доля недействительных, динамика голосования и т.п.), просто это – другая задача.
Для проверки гипотезы были использованы данные по выборам в Госдуму по Москве в 2011 г. (здесь спецучастки не учитываются), для которых имеется реконструкция (основывающаяся на результатах образцово-показательных выборов 2012 и 2013 гг.). Тогда было переброшено около 0,32 млн голосов и вброшено не менее 0,63 млн.
Для каждого из 10 избирательных округов города анализ и реконструкция проводились независимо. на картинке представлен интегральный результат.

В 2011 г. всего по Москве было 624 достоверных, 279 подозрительных и 2471 недостоверных участков, в которых были зарегистрировано соответственно 1,39, 0,55 и 5,25 млн избирателей. Общая достоверность результатов выборов, т.е. охват электората достоверными участками, составляла 19±27% (в зависимости от отнесения подозрительных участков к достоверным или недостоверным). Было переброшено 0,37 млн голосов и вброшено 0,80÷0,87 млн.
Таким образом, предложенный метод даёт несколько большую оценку воровства и существенно большую оценку жульничества по сравнению с прошлым расчётом. Значительный прирост оценки вброса обусловлен скорее, всего тем, что для его величина ранее была получена лишь нижняя оценка, которая, следует признать, оказалась далека от истины. А общее увеличение размеров фальсификаций по обоим каналам связано, по видимому, с тем, что ранее реконструкция проводилась на уровне территориальных избирательных комиссий. Учитывая крайне низкий общий уровень достоверности результатов, разумно предположить, что на каждой территории были недостоверные участки, однако при их малой доле территория воспринималась как достоверная. Кроме того, как можно видеть из рисунка, некоторые результаты некоторых участков на фоне города вызывают большее доверие, чем на фоне лишь своего округа, что тоже могло привести к недооценке фальсификаций.
Резюмируя, методику можно счесть удовлетворительной и применить к сентябрьским выборам.
Перед этим следует сделать два замечания – техническое и принципиальное.
Для большинства участков, расположенных за рубежом (номера 8000+), нет заранее не составленных списков избирателей, что не позволяет определить явку и делает на них невозможной проверку результатов с помощью используемой гипотезы. Такие участки принудительно заносятся в подозрительные. Общее число избирателей, проголосовавших за рубежом, 0,23 млн человек или 0,2% от списочного состава избирателей.
Принципиальным аспектом является то, что если для Москвы можно предполагать, что её жители, которым не повезло проголосовать на мошеннических участках, характеризуются примерно такими же электоральными активностью и настроениями, как те, чьи голоса честно посчитаны, то для всей страны это заведомо не так. Например, жители национальных республик, где результаты выборов фальсифицируются чуть более чем полностью, более склонны к поддержке действующей власти, чем жители крупных русских городов, где результаты выборов иногда подсчитывают и честно.
Задача реконструкция результатов выборов имеет две постановки, очень похожие по форме, но принципиально различающихся по содержанию. Решение этой задачи в её слабой постановке дает ответ на вопрос «Какой результат получился бы, если бы голоса сразу честно посчитали?», а в сильной – на вопрос «Какой результат получится, если голоса всё-таки честно пересчитать?».
Различие постановок связано с тем обстоятельством, что власть, оставленная без общественного контроля, не может не искажать волеизъявление народа в свою пользу. Поэтому изначально честный подсчет возможен лишь там, где в достаточной мере развито гражданское общество, что среди прочего предполагает наличие минимально успешной оппозиции, потенциально способной поднимать своих избирателей на защиту их интересов. Там же, где это условие не выполнено, выяснить мнение избирателя с помощью процедуры голосования оказывается в принципе невозможно. Таким образом, имеется положительная корреляция между поддержкой оппозиции и достоверностью официальных результатов голосования, вследствие чего реконструкция в слабой постановке оказывается менее благоприятной для власти, чем в сильной.
Удивляться тому, что в условиях целенаправленных искажений возникают две «истинных» картины электоральных предпочтений, не следует. Если сильная постановка задачи, будучи по своей сути юридической, ориентирована на восстановление справедливости и отправление правосудия, то слабая, относясь к области социологии, возвращает выборам функционал инструмента, измеряющего взгляды политически-активной части населения.
Для реконструкции выборов в сильной постановке необходим хотя бы однократный (а лучше – неоднократный) честный подсчёт их результатов для рассматриваемого региона. Поскольку во многих субъектов федерации это условие не выполнено, для страны в целом имеет смысл говорить только о реконструкции в слабой постановке. Коль скоро жители некоторых регионов не готовы отстаивать свои избирательные права, их мнение при реконструкции заменяется мнением тех, кто хотя бы отчасти готов на это.
Аналогична ситуация со спецучастками, голосующие на которых избиратели ограничены либо в своих физических возможностях, либо в доступе к информации, либо в свободе выбора голосовать им или нет, а главное – в возможности добиваться уважения к своему волеизъявлению. Поэтому хотя результаты на каких-то спецучастках могут быть подсчитаны честно, используемая методика может записать их в недостоверные. И это справедливо.
Для выборов 2016 г. получились следующие результаты.
Явка: 35,4÷36,4% против официальной цифры в 47,8% – завышена на 31÷35% (на треть).
Антирезультат партии власти: 22,8% против официальной цифры в 21,9% – занижен на 4% (это объясняет, почему для этих выборов неплохо работает ГСС, для которой переброс голосов – нож острый).
Абсолютный результат партии власти: 12,5÷13,6% против официальной цифры в 21,9% – завышен на 90÷107% (т.е. вдвое).
Относительный результат партии власти: 35,4÷37,4% против официальной цифры в 54,2% – завышен на 45÷53% (т.е. в полтора раза).
Проголосовали: 38,9÷40,1 млн чел. против официальной цифры в 52,6 млн чел.
Проголосовали за партию власти: 13,8±15,0 млн чел. против официальной цифры в 28,5 млн чел.
Вброшено голосов за партию власти: 12,6÷13,7 млн, или 44÷48% от её официального результата.
Переброшено голосов партии власти: 1,0 млн, или 3,5% от её официального результата.
Доля избирателей-зомби (по регрессии для достоверных участков): 5,3±3,2%.
Общая достоверность результатов: 40÷52%. Полностью недостоверными являются результаты по 18 округам следующих субъектов федерации: Дагестан (все 3), Ингушетия (1), Кабардино-Балкария (1), Карачаево-Черкесия (1), Кемеровская область (3 из 4), Татарстан (все 6), Тюменская область (все 2), Чечня (1). Спорадические достоверные участки удалось сыскать в некоторых округах Северной Осетии, Кемеровской области, Башкортостана, Мордовии, Крыма, Тывы и даже во всех округах Саратовской области. Общая зависимость доли населения в достоверных участках от общего охвата избирателей по стране представлена на картинке. При её построении округа сортировались по достоверности результатов, которая откладывалась по ординате, а по абсциссе откладывалась с накоплением доля зарегистрированных избирателей.


UPD-1 для tivi_2: Классификация участков на примере Северо-западного округа Санкт-Петербурга, в котором у меня самый низкий разброс точек вокруг прямой. Возможно, я здесь напрасно записал некоторые участки в подозрительные.

Я взял только кусок картинки для лучшего разрешения, но в оставшейся части – только недостоверные участки.

UPD-2: Из-за стремления работать с крупномасштабной картинкой, я в некоторых случаях утрачивал правильное ощущение масштаба и напрасно записывал некоторые участки в подозрительные. Исправился (теперь всегда обязательно снимаю увеличение перед фиксацией результата и не забываю поглядывать на величину разброса точек вокруг прямой). Обсуждаемый УИК №1739 из СПб стал достоверным. Картинка переделана.

Метки:

Comments

termometr
18 ноя, 2016 20:39 (UTC)
не поясните противоречие между гипотезой и официозом? -
http://termometr.livejournal.com/832835.html?view=4638275#t4638275
tov_y
19 ноя, 2016 04:39 (UTC)
Общий ответ таков: «противоречие между гипотезой и официозом» объясняется тем, что гипотеза предполагает, как оно должно быть в реальности, а официоз реальность искажает.
Частный же – по нарисованной Вами картинке – ответ таков:
1) В выбранных Вами координатах моя гипотеза предполагает не прямую линию, а выход на константу по гиперболе.
2) Если Вы строите регрессию, то либо выбирайте абсциссу, определяемую без погрешностей и искажений (для обычной регрессии), либо берите и абсциссу, и ординату, измеряемые в одних и тех же единицах (для регрессии Деминга). Иначе нельзя полагаться на значения рассчитанных параметров.
3) Разные по социально-экономическим и культурным условиям регионы не обязаны укладываться на зависимость с одними и теми же параметрами.
4) Точки надо брать с весами.
termometr
19 ноя, 2016 10:52 (UTC)
Наиболее удобным её видом представляется предположение о линейной связи между явкой и антирезультатом власти (абсолютным результатом оппозиции). Гипотетическая прямая имеет положительный наклон, но не обязана проходить через начала координат, отсекая на оси абсцисс долю избирателей-зомби.
***
можно уточнить, какие именно партии вы тут считаете оппозизией?
tov_y
19 ноя, 2016 10:57 (UTC)
Все, кроме ЕР. Уточню, что меня здесь интересует не их реальная политическая ориентация, идеология и т.п., а только и исключительно то, что у них на выборах голоса в пользу ЕР могут быть украдены, а у ЕР в их пользу - нет (ну, разве что в результате технических ошибок при фальсификации).
termometr
19 ноя, 2016 11:17 (UTC)
выборы 2016 Спб

У меня получилось вот что (практически горизонтальная линия регрессии):
http://termometr.livejournal.com/832835.html?thread=4638531#t4638531

Совершенно непонятно мне явное противоречие с вашим нижним графиком "антирезультат" по СПБ.
tov_y
19 ноя, 2016 11:36 (UTC)
В чём именно Вы видите противоречие?
termometr
19 ноя, 2016 11:41 (UTC)
на вашем графике существенно положительный угол наклона у прямой.
Судя по моему графику величина (100%-%ЕР) должна слабо (и малодостоверно) менятся в ростом явки.
tov_y
19 ноя, 2016 11:46 (UTC)
У меня ордината высчитывается как доля списочного состава избирателей (абсолютный результат), у Вас - как доля явки (относительный результат). Поскольку моя прямая проходит достаточно близко к началу координат, то при делении на абсциссу Вы превращаете её примерно в горизонтальную линию.

Edited at 2016-11-19 11:47 (UTC)
termometr
19 ноя, 2016 11:57 (UTC)
У меня ордината высчитывается как доля списочного состава избирателей (абсолютный результат)
***
Вы показываете на своем графике ту нехитрую истину, что "чем больше людей придет на выборы, тем больше среди пришедших будет людей, голосующих за некоторую партию"?

tov_y
19 ноя, 2016 12:02 (UTC)
А гипотеза Собянина–Суховольского, которую Вы пытались экспериментально проверить, показывает ту нехитрую истину, что поддержка партии не зависит от активности электората.
Все эти истины нехитрые. Вопрос лишь в том, с какой точностью они выполняются и насколько легко дискриминировать избирательные комиссии, фальсификаторская деятельность которых нарушила эти истины.
В случае ГСС с этим возникают сложности, поэтому я от неё и отказался.
termometr
19 ноя, 2016 12:18 (UTC)
1) В выбранных Вами координатах моя гипотеза предполагает не прямую линию, а выход на константу по гиперболе.
***
мне кажется не совсем так. Сначала (при малых процентах явки) "полочка" с высокой долей за ЕР, затем - переход к спадающей гиперболе.

Ни на графике результатов по РФ, ни на графике результатов по СПБ ничего подобного мы не видим. Если отказаться от неявной гипотезы масштабных фальсификаций, то походу ваша гипотеза не правдоподобна.
tov_y
19 ноя, 2016 12:36 (UTC)
Гипотеза:
Антирезультат=Наклон*(Явка-Зомби),
где Антирезультат и Явка характеризуют настроения на отдельном участке, а параметры Наклон и Зомби относятся уже, как минимум, к округу в целом.
Следствие:
АсбРезультат=(1-Наклон)*Явка-Наклон*Зомби
ОтнРезультат=(1-Наклон)-Наклон*Зомби/Явка
termometr
19 ноя, 2016 12:56 (UTC)
Что на участке Явка < Зомби ?
tov_y
19 ноя, 2016 12:57 (UTC)
Нет точек.
termometr
19 ноя, 2016 13:02 (UTC)
теоретически, по вашей гипотезе?
(без темы) - tov_y - 19 ноя, 2016 13:14 (UTC) - Развернуть
(без темы) - termometr - 19 ноя, 2016 13:23 (UTC) - Развернуть
(без темы) - tov_y - 19 ноя, 2016 13:27 (UTC) - Развернуть
(без темы) - termometr - 19 ноя, 2016 13:32 (UTC) - Развернуть
(без темы) - tov_y - 19 ноя, 2016 13:38 (UTC) - Развернуть
(без темы) - termometr - 19 ноя, 2016 14:05 (UTC) - Развернуть
(без темы) - tov_y - 19 ноя, 2016 14:44 (UTC) - Развернуть
(без темы) - termometr - 19 ноя, 2016 14:57 (UTC) - Развернуть
(без темы) - tov_y - 19 ноя, 2016 15:04 (UTC) - Развернуть
(без темы) - termometr - 19 ноя, 2016 15:08 (UTC) - Развернуть
(без темы) - tov_y - 19 ноя, 2016 15:09 (UTC) - Развернуть
(без темы) - termometr - 19 ноя, 2016 15:16 (UTC) - Развернуть

Latest Month

Октябрь 2017
Вс Пн Вт Ср Чт Пт Сб
1234567
891011121314
15161718192021
22232425262728
293031    
Разработано LiveJournal.com
Designed by Lilia Ahner