Товарищ Y (tov_y) wrote,
Товарищ Y
tov_y

Categories:

Как на самом деле проголосовала Белоруссия

Со дня белорусских выборов прошло больше месяца. Сбор копий протоколов с участков, видимо, завершился, т.к. база давно уже не пополняется. Можно выполнить анализ имеющихся данных.

Из 5767 белорусских участков база протоколов покрывает лишь 1310, причём только 1245 из них не имеют пропусков в нужных для анализа графах и не содержат внутренних противоречий (невозможность удовлетворить контрольным соотношениям положительными числами). Но и этого достаточно, чтобы приблизительно реконструировать истинные результаты. Разумеется, речь как всегда идёт об их слабой реконструкции. Т.е. ставится не вопрос, какой был бы результат, если бы всюду посчитали честно и предоставили соответствующие цифры, а вопрос, какой результат получен там, где таки посчитали честно и предоставили цифры.

Основой такой реконструкции является рассмотрение зависимости между общей явкой и явкой против власти. Для социально-однородной территории такая зависимость имеет вид прямой линии с небольшим разбросом точек вокруг неё (точки учитываются с весом, равным числу зарегистрированных избирателей, для построения прямой используется регрессия Деминга). Любые фальсификации в пользу власти сдвигают точки на этой зависимости вправо (вброс голосов) и/или вниз (переброс голосов). Необходимо лишь отделить сравнительно плотный линейный кластер достоверных участков от шлейфа недостоверных и распространить результаты, полученные на первых, на всю страну.

Для белорусского кейса с буквальным выполнением этой программы возникают проблемы.

Во-первых, данных слишком мало, чтобы можно было дробить страну на более-менее однородные территории. Поэтому используется очень грубое разбиение на Минск (без зарубежных участков), зарубежные участки, города с населением свыше 100 тыс. чел. (Гомель, Витебск, Могилёв, Гродно, Брест, Бобруйск, Барановичи, Борисов, Пинск, Орша, Мозырь, Лида, Солигорск) и глубинку (все остальные населённые пункты). При ожидаемо невысокой точности реконструкции такое грубое разбиение представляется приемлемым. В столичную группу попадает 30,7% протоколов, в зарубежную – 1,9%, в городскую – 31,2%, в глубинную – 36,1%.

Во-вторых, чрезвычайно высокий уровень фальсификаций вынуждает аппроксимировать зависимость для достоверных участков прямой пропорциональностью, поскольку при использовании линейной зависимости со свободным членом метод теряет устойчивость. В его основе – экспертное (в смысле: визуальное) определение некоторых участков как заведомо недостоверных (достоверных). При переклассификации какого-то участка с достоверного на недостоверный (или обратно) все участки, которые лежат дальше от (ближе к) регрессионной прямой, чем он, автоматически объявляются недостоверными (достоверными), после чего параметры прямой пересчитываются. Если погонять пограничные участки туда-сюда, полученное разделение должно сохраняться, чего при двухпараметрической аппроксимации здесь не получается, так что приходится использовать однопараметрическую. Содержательно это означает, что мы пренебрегаем наличием зомби-избирателей, всегда приходящих на участки и всегда поддерживающих власть. В случае предреволюционной ситуации, когда наличие зомби компенсируется протестной мобилизацией ранее аполитичных избирателей, такое огрубление можно считать допустимым.

Для Минска достоверны лишь 9,7% участков (37 из 382). Огромный кластер заведомо фальсифицированных участков поражает воображение! Оценка явки – 81,3%, результатов Лукашенко и Тихановской – 34,4% и 49,9%. Соотношение пропорций облака достоверных точек (стандартное отклонение вдоль прямой к отклонению поперёк) – 11,6.

Для крупных городов достоверны уже 15,2% участков (59 из 389). Оценка явки – 79,3%, результатов Лукашенко и Тихановской – 35,9% и 50,5%. Соотношение пропорций облака достоверных точек – 13,3.

Для глубинки достоверны 17,1% участков (77 из 450). Оценка явки – 76,5%, результатов Лукашенко и Тихановской – 30,8% и 56,8%. Соотношение пропорций облака достоверных точек – 9,3. Исходно большая разнородность населённых пунктов, входящих в эту группу обеспечивает возможность подобрать больше точек, но покупается это ценой худшей аппроксимации.

Для зарубежья все 24 участка, для которых данные полны и непротиворечивы, считаются достоверными, т.к. на таких участках явка может быть фиктивной величиной, что не позволяет выполнить анализ. Результаты Лукашенко и Тихановской – 19,0% и 77,0%.

Если собрать все достоверные участки (197 из 1245), получается оценка явки – 78,8%, результатов Лукашенко и Тихановской – 32,8% и 53,9%, т.е. инкумбент получил поддержку в 1,64 раза меньше своей конкурентки, проиграв ей в первом же туре.

Из полученных цифр явку за Лукашенко и Тихановскую можно определить в 25,9% и 42,5% соотвественно. Эти величины можно попробовать оценить (первую – снизу, вторую – сверху) и другим способом. Очевидными коррелятами фальсификаций являются досрочное и надомное голосование, а также большое количество испорченных/исчезнувших бюллетеней. Рассматривая досрочную, надомную и протестную явки как независимые переменные, строим линейные регрессии для явок за кандидатов. При этом число участков, пригодны для анализа, сокращается до 1170, т.к. не для всех участков имеются все необходимые данные.

Для Лукашенко регрессия получается пристойной: R2 = 49%, β-коэффициенты равны соответственно 0.68, 0.22 и −0.15, а свободный член – 18,5±1,2%. Если считать, что чистым выборам соответствует независимость явки за кандидатов от распространённости досрочного, надомного и протестного голосования, то свободный член и даст поддержку инкумбента. В реальности, конечно, зависимость имеет место, поскольку при досрочном и надомном голосовании выше риск фальсификации, т.е. получена оценка снизу. Поэтому оценка оказалась занижена на 7,4% пункта.

Для Тихановской регрессия получается заметно хуже: R2 = 34%, β-коэффициенты равны соответственно 0.53, 0.08 и −0.22, а свободный член – 48,9±1,3%, что на 6,4% больше чем в реальности.

Эти расхождения дают представление о том, насколько искажение избирательных процедур при многодневном голосовании влияет на то, когда избиратели приходят к урнам.

Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 4 comments