?

Log in

No account? Create an account

Previous Entry | Next Entry

В основе методов реконструкции Собянина–Суховольского и Шпилькина лежит эмпирическое установление некоторой статистической закономерность, которой подчиняются результаты всех партий, кроме партии власти. Это позволяет высказать разумное предположение о фальсификации выборов в её пользу и в его рамках реконструируется истинный результат путём устранения отклонения от установленной закономерности.
Беда этих методов состоит в недоказуемости исходного предположения. Теоретического обоснования оно заведомо не имеет, поскольку гипотетически возможны ситуации, когда оно нарушается (хотя их применимость к российским выборам сомнительна). Практическое его обоснование также проблематично, поскольку все используемые данные «расходуются» на расчёт размеров фальсификации. И мы уже не имеем возможности выяснить, до какой же степени всё-таки верно наше предположение, если оно, вдруг, верно не вполне.
Таким образом, необходимо привлечение дополнительных данных, не связанных непосредственно с результатами голосования.В качестве таких данных предлагается использовать динамику явки избирателей.
Для почти всех избирательных участков имеются данные о доле избирателей, проголосовавших к 10, 12, 15 и 18 часам местного времени. Отнормируем её на итоговую явку и рассмотрим распределение полученных величин (участки берутся с весами, равными числу зарегистрированных на них избирателей). Среднеквадратичное отклонение квантильных уровней отнормированной явки от медианного значения (далее – отклонение) выберем в качестве характеристики избирательного участка.
Update (06/02/12): Расчёты делаются отдельно для городских и сельских населённых пунктов. Судовые ТИК из рассмотрения исключены.
Никакого прямой связи между величиной отклонения и активностью избирателей или их политическими симпатиями, по идее, быть не должно. Однако, как видно из рисунка, она есть и весьма существенная.

Наиболее активный народ почему-то приходит на участки наименее типичным образом. Считать свободным от искажений можно только горизонтальный участок графика, соответствующий низким отклонениям. Таким образом, истинная явка составляет примерно 52÷53% (против официальных 60%). Примечательно, что эта величина совпадает для всех участков и для участков, оборудованных сканерами – комплексами обработки избирательных бюллетеней или комплексами электронного голосования. Использование этих устройств не препятствует фальсификации процедуры выборов, но осложняет фальсификацию их результатов.
На врезке даны результаты по всем участкам, на которых отклонение не превышает абсциссы. Интегральное представление позволяет иметь дело с более гладкими графиками, для которых легче визуально оценить то максимальное отклонение (примерно 15÷20%), при котором уже несущественны флуктуации, но ещё несущественны фальсификации. Именно в таком виде будет представлены все дальнейшие графики.

Сравним зависимости от максимального отклонения результатов партии власти и суммарного результата 6 оппозиционных партий. Здесь уже графики для участков со сканерами и без них не совпадают, поскольку если явка фальсифицируется только реальным или виртуальным вбросом бюллетеней, то результат – ещё и кражей голосов. Расстояние между графиками позволяет очень приблизительно (не будем забывать, что одинаковые абсциссы у графиков соответствуют разным наборам избирательных участков) оценить масштабы кражи в 3÷5% от числа избирателей.
Истинные результаты партии власти и оппозиционных партий составляют, соответственно, примерно 17% и 35% от числа избирателей (и ещё чуть менее 1% досталось поросёнку Нах-Нах). В пересчёте к доле избирателей, принявших участие в голосовании, эти цифры превратятся в 32% и 66%. Таким образом, уровень поддержки власти на выборов не достигает и 1/3, что даже меньше результатов социологических опросов.

Сравнение истинных результатов партий с официальными позволяет отдельно оценить масштабы фальсификации процедуры выборов и масштабы фальсификации их результатов. Горизонтальные участки графика дают 8 млн голосов, полученных партией власти в результате вброса бюллетеней, несвободного голосования и приписок, и еще 6 млн – как результат передачи ей голосов, реально отданных за оппозиционные партии. В сумме – 14 млн голосов, или примерно 80% от истинного результата.

Очень любопытным образом распределились кражи голосов по партиям. Больше всего обидели бабл-боя этих выборов – «Яблоко». У него в процентом отношении спёрли в 2÷3 раза больше, чем у партий прошедших в Думу, и даже больше, чем у аутсайдеров. Честный подсчёт голосов всё равно не позволил бы «Яблоку» преодолеть 7%-барьер (хотя избавил бы Явлинского от необходимости собирать подписи), но психологически феномен очень показательный.


UPD-1: Теперь посмотрим, что происходит с распределениями вероятности.
Приведённые ниже гистограммы построены с бинами 0,25% для всех участков и 1% для участков, оборудованных КОИБ/КЭГ. Все участки учитывались с весом, равным числу зарегистрированных избирателей. Чтобы устранить артефакты, возникающие из-за рассмотрения отношения целых чисел, неабсолютные результаты подвергались дизерингу посредством добавления к числителю случайной величины, равномерно распределённой на промежутке (–½;+½). Данная процедура повторялась 100 раз и результаты усреднялись.
Отдельно приведены результаты для участков с высоким (>25% – High) и низким (≤25% – Low) значением отклонения.

Видно, что по мере устранения из выборки сомнительных участков распределение по явке становится всё более узким и островерхим. Однако, как можно видеть из динамики коэффициентов асимметрии и эксцесса, то, что получается после реконструкции, – это не только не гауссово распределение, но и дальше от него, чем было исходное распределение (хотя визуально и может показаться, что получилась гауссиана). Дело в том, что очистка от «мусора» не устраняет из выборки всех участков с высокой явкой. Соответственно, центральные моменты уменьшаются не очень сильно (тем более, что смещение математического ожидания влево дополнительно препятствует их уменьшению). А вот среднеквадратичное отклонение уменьшается сильно. В результате коэффициенты асимметрии и эксцесса возрастают. Таким образом, чем дальше, тем сильнее график плотности скашивается влево и становится избыточно островерхим. Это дополнительный довод не требовать от «честных» распределений гауссова вида.

Аналогичная ситуация, только ещё в большем масштабе, имеет место для доли голосов, набранных партией власти. Следует отметить, что для участков с низким отклонением сохраняются пики на красивых процентах. Впрочем, это неудивительно, поскольку такие цифры, творимые на этапе заполнения протоколов, никак не связаны с динамикой явки.


UPD-2:
Теперь посмотрим на зависимость доли голосов набранных партиями, от явки. Как и в предыдущем фрагменте отдельно рассмотрены участки с высоким (>25% – High) и низким (≤25% – Low) значением отклонения, а все участки учитываются с весом, равным числу зарегистрированных на них избирателей.

В отличие от распределений по явке и результату, эта зависимость почти не чувствительна к динамике активности.

Аналогичным образом, наличие или отсутствие сканеров почти не сказывается на зависимости результата партии от явки. Хотя происходит некоторое уширение горизонтальных областей в левых частях зависимостей.
Эти результаты могут показаться противоречащими выводам о масштабах фальсификации. Однако противоречие это кажущееся. По мере очистки выборки от фальшивых замеров правые части зависимостей, соответствующие большой явке, теряют свою значимость. Вместе с тем, поскольку все фальшивые замеры вычистить всё равно не удаётся, отклонение графиков от горизонтального вида в этих частях сохраняется.


UPD-3:
По просьбам трудящихся выкладываю распределение участков по среднеквадратичному отклонению квантильных уровней отнормированной явки от медианного значения.

Красная линия соответствует участкам, взятым с единичным весом, синяя – с весом, равным числу зарегистрированных избирателей.
Из того, что пик красной кривой не воспроизводится на синей, можно заключить, что он соответствует очень маленьким участкам, на которых возможны чудовищные флуктуации в динамике явки.


UPD-4: oude_rus обнаружил ещё один признак липовых результатов ЕР – нулевое количество недействительных бюллетеней. Посмотрим на то, как данный критерий сказывается на распределении участков по отклонению явки.

Т.е. нулевой уровень недействительных бюллетеней добавляет 6 процентных пунктов к отклонению.


UPD-5: Истинный результат ЕР, или усреднённым экспертам посвящается
Поскольку, как я узнал у экспертов имеется консенсус относительно истинного результата ЕР на уровне 38-41%, выкладываю график зависимости её результата от максимального отклонения:

Как можно видеть, нижняя граница экспертных оценок чуть выше той цифры, которая получается, если вообще не исключать участки с сильно нетипичной динамикой явки. Видимо, я не вполне эксперт, но лично я ориентируюсь на полочку графика при абсцессе 15-20%.



Метки:

Comments

( 62 комментария — Оставить комментарий )
winpooh
3 фев, 2012 09:34 (UTC)
> Никакого прямой связи между величиной отклонения и активностью избирателей или их политическими симпатиями, по идее, быть не должно.

Неочевидно. Идею - в студию.
tov_y
3 фев, 2012 09:41 (UTC)
Если кто-то сумеет предложить сценарий систематического изменения явки/результата с ростом отклонения, тогда можно будет что-то обсуждать. Но думаю, что предложить такой сценарий не удастся, что и обозначено оборотом «по идее».
(без темы) - winpooh - 3 фев, 2012 09:51 (UTC) - Развернуть
(без темы) - tov_y - 3 фев, 2012 10:15 (UTC) - Развернуть
winpooh
3 фев, 2012 09:36 (UTC)
Да, и где на графике голоса, украденные у Единой России?
tov_y
3 фев, 2012 09:43 (UTC)
Нигде. Если её истинный результат меньше официального, значит у неё ничего не украдено (разумеется, речь идёт об интегральных показателях), а ей добавлено.
(без темы) - winpooh - 3 фев, 2012 09:47 (UTC) - Развернуть
(без темы) - tov_y - 3 фев, 2012 09:57 (UTC) - Развернуть
kobak
3 фев, 2012 10:29 (UTC)
1. Интересно!

2. Несколько раз перечитал вводный абзац

"Для почти всех избирательных участков имеются данные о доле избирателей, проголосовавших к 10, 12, 15 и 18 часам местного времени. Отнормируем её на итоговую явку и рассмотрим распределение полученных величин (участки берутся с весами, равными числу зарегистрированных на них избирателей). Среднеквадратичное отклонение квантильных уровней отнормированной явки от медианного значения (далее – отклонение) выберем в качестве характеристики избирательного участка"

-- но всё равно не уверен, что правильно понял, как Вы считаете отклонение. Напишите поподробнее, пожалуйста. Но если я правильно, понял общую идею, то "отклонение" характеризует величину максимального скачка между двумя отметками явки.

3. На втором графике у Вас в легенде синяя и красная кривые не перепутаны? Если нет, то ничего не понятно.

4. Общий разультат (32%) кажется преуменьшенным. Возможно, это потому, что Вы все калибруете по коибам, а они стояли по большей части в городах и тд.

5. Любопытно было бы еще посмотреть на диаграммы рассеяния (а не только средние линии): отклонение-явка и отклонение-результат ЕР...
kobak
3 фев, 2012 10:30 (UTC)
По поводу (3): либо я ошибся, либо Вы уже исправили. В любом случае, теперь всё в порядке.
(без темы) - tov_y - 3 фев, 2012 11:30 (UTC) - Развернуть
(без темы) - tov_y - 3 фев, 2012 11:30 (UTC) - Развернуть
(без темы) - kobak - 3 фев, 2012 13:45 (UTC) - Развернуть
(без темы) - kobak - 3 фев, 2012 13:56 (UTC) - Развернуть
(без темы) - tov_y - 3 фев, 2012 15:45 (UTC) - Развернуть
kireev
3 фев, 2012 11:04 (UTC)
Спасибо за исследование. Помимо уже сказанного, что КОИБы стояли преимущественно в городах, я бы еще добавил, что фальсифицировали чаще там, где у ЕР был и честно бы выше результат, и это искажает оценку фальсификаций.
kobak
4 фев, 2012 13:52 (UTC)
А нарисуйте гистограмму кол-ва участков по отклонению, а то непонятно, где сколько. Лучше даже не участков, в суммы голосов по участкам с данным отклонением.
tov_y
4 фев, 2012 14:54 (UTC)
Я не вполне понимаю, что Вы там ожидаете увидеть. Но пусть будет – см. Update-3.
P.S. Разумеется, я не рисовал гистограмму для суммы голосов (что толку анализировать распределение, построенное со случайными весами точек?), а рисовал для суммы числа избирателей (впрочем, они очень близки).
(без темы) - kobak - 4 фев, 2012 15:15 (UTC) - Развернуть
(без темы) - tov_y - 5 фев, 2012 09:49 (UTC) - Развернуть
barouh
6 фев, 2012 09:05 (UTC)
Спасибо. Очень интересно

Но с базовым предположением - что отклонения в почасовой динамике явки от среднего никак не связаны с активностью и политическими предпочтениями - не соглашусь

Поддержка ЕР выше на селе (насколько выше - открытый вопрос), там же меньше средний размер участков (что повышает вероятность естественных отклонений распределения явки от "нормы", в т.ч. в сторону активного утреннего голосования) и ниже уровень квалификации членов избиркомов - соответственно, выше вероятность небрежности и ошибок при подсчете и сообщении наверх цифр по промежуточной явке

Даже в Москве наблюдаются очень большие различия между участками (в т.ч. с 25%-ным результатом ЕР) по почасовой явке - обусловленные, видимо, не различиями в поведении избирателей, а ошибками УИКов. Что уж говорить про малые города и село

Я согласен, что отклонения по почасовой явке связаны с фальсификациями, но эта связь не жесткая и не линейная. И через сопоставление одного и другого оценивать реальные результаты выборов ИМХО нельзя

Было бы интересно применить Ваш метод к большим относительно однородным массивам участков - например, московские участки (за вычетом спецучастков), или аналогично по Питеру, Екатеринбургу, Нижнему


Edited at 2012-02-06 13:16 (UTC)
tov_y
6 фев, 2012 15:32 (UTC)
tsirel в привате уже высказал предположение, что может быть существенным, имеем ли мы дело с городом или деревней. Я всё переделал с разбивкой, т.е. мы смотрим отклонение от медианы распределения, соответствующего типу ТИК – городская или сельская. Кроме того, полностью исключены из рассмотрения все судовые ТИК, где данные о динамике явки – заведомая туфта (не потому что специально врут, а потому что то ли не собирают данных, то ли не имеют списков избирателей). Все рисунки обновлены. Что-то, конечно, поменялось, но, имхо, не принципиально.
P.S. О крупных городах – подумаю, но я не умею вычленять спецучастки.
(без темы) - barouh - 6 фев, 2012 16:29 (UTC) - Развернуть
(без темы) - tov_y - 6 фев, 2012 23:15 (UTC) - Развернуть
(без темы) - barouh - 7 фев, 2012 02:47 (UTC) - Развернуть
(без темы) - barouh - 6 фев, 2012 16:50 (UTC) - Развернуть
(без темы) - tov_y - 6 фев, 2012 23:13 (UTC) - Развернуть
(без темы) - barouh - 7 фев, 2012 02:53 (UTC) - Развернуть
(без темы) - tov_y - 7 фев, 2012 03:33 (UTC) - Развернуть
(без темы) - barouh - 7 фев, 2012 03:52 (UTC) - Развернуть
barouh
6 фев, 2012 09:49 (UTC)
Больше скажу. Если вдуматься в Ваш график про зависимость результата ЕР от явки для двух групп участков (повторяю его ниже для наглядности), то получается, что "дихотомия" участков с большим и маленьким разбросом почасового распределения явки является по большей части следствием базовой "дихотомии" на участки с нормальной и аномально высокой явкой

И какая-то небольшая самостоятельная объясняющая (результаты выборов) сила у такого параметра, как отклонение почасового распределения по явке, появляется только в той зоне, где смешиваются участки с высокой естественной явкой и слегка завышенный явкой (50-65%)



Я примерно такой же вывод получил по Москве. Сначала вдохновился, что мол отклонения по почасовой явке все наглядно показывают - а потом оказалось, что почти столь же четкий "прогноз" результата ЕР можно получить из общей за весь день явки на участке
tov_y
6 фев, 2012 15:53 (UTC)
Этот график специально нарисован, чтобы продемонстрировать тот факт, что типичная у нас динамика явки или атипичная, но зависимость явка–результат для партий будет одной и той же. В отличие от плотностей она не меняется. А вот по плотности изменения существенные – мы съезжаем в область умеренных явок.
Разумеется, можно просто сказать, что мы не доверяем высоким явкам и потому их отбрасываем. Можно, но это нехорошо, т.к. получается, что мы сначала предполагаем фальсификацию по определённому типу, а потом лишь убеждаемся, что наше предположение не приводит к противоречию. Да, численный результат при этом получается более-менее разумным (см. мой декабрьский пост), но сам метод доказательной силой не обладает, поскольку гипотеза Собянина–Суховольского в общем случае неверна…
И кстати, я общую за весь день явку использую для нормировки, т.е. работаю с относительными величинами. А то, если брать явку как таковую, то, конечно, у нас участки с большой явкой сразу окажутся атипичными. Но это – получение запрограммированного ответа. Тогда уж проще их сразу отбросить, сказав, что, вот, не верим мы им и всё тут.
(без темы) - barouh - 6 фев, 2012 16:25 (UTC) - Развернуть
(без темы) - tov_y - 6 фев, 2012 23:07 (UTC) - Развернуть
(без темы) - barouh - 7 фев, 2012 02:42 (UTC) - Развернуть
(без темы) - tov_y - 7 фев, 2012 03:27 (UTC) - Развернуть
tsirel
11 фев, 2012 16:27 (UTC)
Андрей, решил ответить в блоге.

СЦ - у ЕР в среднем по России 38-41%.
ЭТО ЧИСЛО ПОЛУЧИЛОСЬ И У МЕНЯ, И У КОБАКА, И КИРЕЕВА.
ПРИ ЭТОМ НИКТО НЕ ПОЛУЧИЛ ЕГО С ПОМОЩЬЮ СТРОГО ОПРЕДЕЛЕННЫХ ВЫЧИСЛЕНИЙ
ПО ВНЯТНО СФОРМУЛИРОВАННОЙ МЕТОДИКЕ.
И, ТЕМ НЕ МЕНЕЕ, ВСЕ ТРОЕ НЕЗАВИСИМО ДРУГ ОТ ДРУГА ПРИШЛИ К ПРИМЕРНО
ОДИНАКОВОМУ РЕЗУЛЬТАТУ.
В ОБЩЕМ СЧИТАЙТЕ, ЧТО ЭТО КОНСЕНСУСНАЯ ЭКСПЕРТНАЯ ОЦЕНКА

АП.- Насколько я понимаю, во всех случаях эта оценка возникает как
результат частичного анализа (рассмотрение отдельных регионов,
отдельных типов фальсификации, смешение вброса и переброса).
В конце концов, анализируя данные участков с/без КОИБ/КЭГ по тем
территориям, где такой анализ возможен (методика не обнародовалась, а
результаты я постил кому-то в каменты), я получил близкую цифру
(37,2%). Как верхняя граница диапазона истинных результатов величина
40-% мне представляется разумной и обоснованной (полку экспертов
прибыло). Как оценка положения середины этого интервала - нет.

Ответ – посмотрите данные у Киреева (и не только у него)

М и СПб – 26-28%
Большие и средние русские города 30-35%
Малые русские города 35-40%
Села от 40% на севере до 45 и более % на юге
Национальные республики 40-60%
Спецокруга 50-100%.

Ну не получится в среднем 32%
tov_y
11 фев, 2012 17:22 (UTC)
Здесь есть два важных момента – очевидный и неочевидный.
Очевидный – способ определения истинного результата голосования для конкретного региона. Если какой-то тип искажений не удалось отловить/скомпенсировать, то результат считается истинным. Но при анализе данных в розницу никогда и не удастся отловить/скомпенсировать все типы искажений – уж больно они разнообразны.
Неочевидный – понимание того, а что такое на самом деле истинный результат выборов. Наивно думать, что это то, что получится, если мы проведём в регионе голосование и подсчёт его результатов без нарушений. Во многих регионах такое возможно лишь в том случае, если туда войдут войска НАТО (да и то, скорее всего, в какой-нибудь Чечне всё равно будет 99,9%, только наберёт их Демократическая партия США). Честность выборов неразрывно связана с развитостью гражданского общества, каковая – вот незадача! – у нас находится в обратной зависимости от рейтинга партии власти. Чем выше истинный уровень поддержи ЕР в регионе, тем вероятнее и масштабнее в нём подтасовки в её пользу. Реконструкция истинного результата в регионе предполагает распространение на него тех условий, которые обеспечивают честность выборов и неизбежно сопряжены с некоторым снижением результатов партии власти. Поэтому неудивительно, что моя реконструкция даёт цифры ниже экспертных оценок и данных опросов. Эти оценки и опросы измеряют величину, которая на честных выборов никогда не может быть зарегистрирована, поскольку высокое её значение в некоторых регионах в принципе исключает возможность проведения там честных выборов.
(без темы) - tsirel - 11 фев, 2012 17:57 (UTC) - Развернуть
(без темы) - tov_y - 12 фев, 2012 01:54 (UTC) - Развернуть
tsirel
11 фев, 2012 16:27 (UTC)
О методе
Сама идея остроумная.
Метод реализации неочевидный и неединственный,
Но я не буду его обсуждать, наверняка Вы перепробывали разные варианты.

При этом Вы исходите из того, что фальсификации очень тесно связаны с порядком явки,
а сама выборка однородная. Прежде всего в ней нет корреляций результатов
голосования с порядком явки.

Утверждение сомнительное - наверняка есть различия порядка явки,
завмсящие от др. факторов, причем б-во таких отклонений еще в той или иной
степени коррелировано с явкой и результатом ЕР. Город/село - самое
напрашивающееся различие, но есть и другие -
в Питере образ жизни более "совиный", чем в Москве, рабочие города более
"жаворонковые" и т.д.
Последние различия невелики, но они могут перебросить фальсифицированные результаты в большим городам в категорию Low, а честные и почти честные результаты по селам - в категорию High.

Есть еще важный вопрос – как заполнялись данные по явке по часам.
- честно и точно (как при этом учитывались открепительные и голосование на дому?)
- на глазок,
- абы как
- подсчитывались с тем, чтобы учесть вбросы.
От распределения по эти типам зависит допустимость самого метода.
tov_y
11 фев, 2012 17:32 (UTC)
Часть заданных Вами здесь вопросов уже рассматривалась в переписке – не буду повторяться. Я как не видел факторов, связанных с уровнем активности населения или его политическими симпатиями, систематически (а не случайно) смещающих отклонение динамики явки, так и не вижу их.

Данные по часам заполнялись чаще всего на глазок. Причём для тех регионов, где указана и пятая временная отсечка (на момент закрытия участка), её значение может не совпадать с итоговой явкой – тем сильнее, чем больше доля бюллетеней в переносных ящиках. Т.е. временнАя привязка голосования на дому вообще может быть произвольной.
(без темы) - tsirel - 11 фев, 2012 17:59 (UTC) - Развернуть
(без темы) - tov_y - 12 фев, 2012 02:00 (UTC) - Развернуть
tsirel
11 фев, 2012 16:28 (UTC)
По графикам

График с плотностью вероятности.
Видно, что процент за ЕР резко падает низком отклонении,
Но тип распределения сохраняется.
Совсем нехорошо, что сохраняются пики у круглых процентов.
ПОДОЗРЕНИЕ – низкое отклонение характеризует не только фальсификацию и другие факторы, сильно коррелированные с кол-вом голосов за ЕР.
См. выше подозрение, что это географический фактор и тип поселения.

Графики доли голосов от явки у Low & High.
Очень плохо, что различия малы. Значит фальсификация ничего не исказила?
Подозреваю, что другие факторы больше влияют на отклонение, чем фальсификация.

Графики плотности распределения отклонения.
Распределение гладкое, почти симметричное и режете Вы его
практически по моде – слева от моды, справа от моды.
Совершенно неубедительно. Вот если оно было двухмодальным!

Вывод: идея остроумная, но, к сожалению, себя не оправдала. Ваш показатель не меньше (а м.б и больше) зависит от др. факторов, чем от фальсификации.

Более общий вывод – выборка очень неоднородна и невозможен чисто математический метод ловли фальсификаций без учета электоральной географии.
tov_y
11 фев, 2012 18:04 (UTC)
1) Фальсификации можно типировать на фальсификацию процедуры выборов (сюда входят вбросы, карусели, принудительное и несвободное голосование) и фальсификацию результатов голосования (рисование в протоколах цифр, никак не связанных с физически находящимися в урнах бюллетенями).
Именно второй тип фальсификаций рождает пики на красивых цифрах. Но он не может быть отловлен с помощью анализа динамики явки, т.к. никто не мешает передавать Единой России голоса других партий в рамках реально имевшей место явки и её временнОй динамики (ловить фальсификации результатов голосования помогают данные с участков, оборудованных сканерами). Кроме того, не любая фальсификация по первому типу будет выявлена нетипичной явкой. Найдутся места, где бюллетени вбрасывали примерно в том же ритме, что и живые люди приходили (поэтом графики доли голосов от явки и сохраняют свой вид после реконструкции – просто вес их правых частей существенно убывает).

2) Когда я режу, я режу не график распределение отклонения. Я режу график явки от отклонения по точке, где более-менее горизонтальный участок сменяется отчётливо растущим.
Так же – см. UPD-5.
tsirel
12 фев, 2012 12:50 (UTC)
Кратко отвечу на все комментарии
1) Разные виды фальсификаций, фальсификации и явка, явка и реальный % за ЕР и др. коррелированы между собой. Это надо учитывать.
2) Вы режете, основываясь на конце более или менее горизонт. участка, но само распределение все режется через его моду.
3) Кобак насчитал, что КОИБы с разбивкой по регионам снижают кол-во голосов ЕР всего на 6-7% - http://kobak.livejournal.com/103331.html. Не смотрел, насколько это верно, но участки с КОИБами всяко не образуют репрезентативной выборки.
4) Реконструкции поддается очень многое (есть еще экзит-пол, соц. опросы и др.), только с разной степенью достоверности.
5) Идею об отметании электоральной географии даже обсуждать не хочется, настолько она противоречит сути самой социолгической задачи. Кстати, деление город/село и наличие особых регионов Вы признаете.
6) Имея опыт точного подсчета, более грамотный человек лучше сделает приближенную оценку, чем малообразованный. Ирония здесь совершенно неуместна. Если бы Вы ходили в походы, то Вы бы знали, как плохо местные жители указывают расстояния в километрах в прекрасно знакомой им местности.
tov_y
12 фев, 2012 13:28 (UTC)
1) Да. И это проблема. Иначе можно было бы затачивать разные алгоритмы на отдельные типы искажений, применять порознь, а потом тем или иным образом суммировать результаты. Но приходиться сразу ставить двойное сито – и то мало!
2) Ну, где разрезалось, там разрезалось.
3) Сильно занижено! Я это делал сам и получил цифру в 14,1% (как процент от явки) и 10,9% (как процент от числа избирателей). А делал я следующим образом. Брал данные по всем ТИК, в которых как на участки с КОИБ/КЭГ, так и на участки без оных приходилось не менее 2,5% зарегистрированных на всей территории избирателей. Порог отсечения выбирался так, чтобы суммарные результаты по всем рассматриваемым ТИК минимально отличалась от показателей по стране (это и есть своего рода репрезентативность). При указанном значении порога среднеквадратичное отклонение результатов партий (как доля числа избирателей) составило 0,2% (главным образом за счёт КПРФ), отклонение явки – 0,1%. Никакие данные по динамике явки, разумеется, не использовались. Кстати, по результатам такой реконструкции, не учитывающий целый пласт различных способов фальсификаций, я получил 10 млн липовых голосов за ЕР и оценку её истинного результата в 37,2% (что ниже минимума диапазона экспертных оценок, но, несомненно, выше истинного результата).
4) Экзит-полы и соцопросы сами нуждаются в реконструкции. Вам причины перечислить?
5) Я не отметаю электоральную географию. Я просто чётко различаю анализ в розницу и оптом. Обосновывать массовость, разнообразие и наглость фальсификаций и даже делать какие-никакие выводы социологического плана уместней в розницу. Считать общий результат – оптом. Странно было бы полагать антагонистами уравнения динамики и законы сохранения. Но надо понимать, что от какой стенки гвоздь.
6) Я думаю, что у человека, который хотя бы раз считал бюллетени, опыт подсчёта куда больше, чем у просто грамотного человека. Что же до походов, то если хотите получить ответ в километрах, то и спрашивайте, давая человеку карту, а если всё-таки предполагаете идти ногами, а не только скользить взглядом по карте, спрашивайте, как оно в часах пути. Формулировать вопрос не том языке, на котором говорит собеседник, означает гарантировать себе искажённый ответ.
(без темы) - kobak - 12 фев, 2012 14:40 (UTC) - Развернуть
(без темы) - tov_y - 12 фев, 2012 15:42 (UTC) - Развернуть
(без темы) - kobak - 12 фев, 2012 16:17 (UTC) - Развернуть
(без темы) - tov_y - 14 фев, 2012 23:33 (UTC) - Развернуть
(без темы) - tov_y - 20 фев, 2012 04:04 (UTC) - Развернуть
(без темы) - tsirel - 12 фев, 2012 14:51 (UTC) - Развернуть
(без темы) - tov_y - 12 фев, 2012 16:03 (UTC) - Развернуть
(без темы) - tsirel - 12 фев, 2012 14:58 (UTC) - Развернуть
(без темы) - tov_y - 12 фев, 2012 16:09 (UTC) - Развернуть
(без темы) - tsirel - 12 фев, 2012 16:23 (UTC) - Развернуть
(без темы) - tov_y - 14 фев, 2012 23:35 (UTC) - Развернуть
(без темы) - tsirel - 15 фев, 2012 05:26 (UTC) - Развернуть
(без темы) - tov_y - 15 фев, 2012 05:27 (UTC) - Развернуть
( 62 комментария — Оставить комментарий )