시사정보 큐레이션/국내외 사회변동外(2)

■■[4.15 총선 개표조작 확실] 미베인 교수의 3차 결과보고서...데이터 오류 논란 종결■■

배세태 2020. 5. 14. 13:31

※Mebane 교수님의 3차 결과보고서 (데이터 오류 논란 종결)

 

조금 전에 Mebane 교수님이 업데이트된 (3차) 결과보고서를 보내주셨습니다. 업데이트된 결과보고서는 다음 링크에서 받아보실 수 있습니다.

http://www.umich.edu/~wmebane/Korea2020.pdf

 

이번 결과보고서에서는Mebane 교수님이 그동안 서울대 박원호 교수님과 카이스트 이병태 교수님이 지속적으로 문제를 제기해주신 "잘못된 데이터를 사용함으로써 부정선거 결과가 과장/왜곡되었을 가능성" (이른바 "garbage in, garbage out" 문제)을(를) 해결하기 위해, 서울대 박원호 교수님의 조언에 따라 (그 이전 데이터에서는 생략되었던 50명의 무소속 후보들이 새롭게 추가된) 보다 완전한 데이터를 가지고 분석을 한 결과가 담겨있습니다. 아울러, 이번에 분석에서 사용된 새로운 데이터에는 그 동안 문제로 지적되었던 사전투표에 나타난 ‘대각선 상 데이터’가 더 이상 존재하지 않습니다. (첨부된 Figure 4와 Figure 5에서 사전투표(prevote)에서 대각선 상 데이터가 더 이상 발견되지 않는 것을 확인할 수 있습니다.)

 

결론적으로 말해서, 오류가 제거된 데이터를 사용해서 재분석해본 결과, 이번 21대 총선에서 선거부정이 감지되었다는 결과는 달라지지 않았다는 것입니다.

 

[요약]

 

1. 한국의 21대 총선에 대한 기존의 통계적 분석 결과를 보강하기 위해서, 서울대 박원호 교수의 조언에 따라 (사전투표에서 대각선 상 데이터 오류가 수정된) 보다 완전한 데이터를 가지고 통계분석을 다시 시도하였다. 아울러, 그러한 분석 결과의 타당성 검토를 위해 여러 가지 통계적 테스트를 추가적으로 실시하였다.

 

2. 그 결과 최초의 페이퍼에서 제기되었던 선거부정 의혹은 재확인되었고, 오히려 강화되었다.

 

3. 여러가지 통계적 테스트를 실행해본 결과, 한국의 21대 총선에서 나타난 여러 통계적 이상수치/변칙(anomaly)들은 자연적인 방식으로 발생했다고 보기에는 혹은 유권자들의 전략적 투표행위 등에 의해 설명되기에는 그 수치가 지나치게 벗어나 있다.

 

4. 이상을 종합적으로 고려할 때, 한국의 이번 2020년 의회선거에서는 선거 데이터가 사기적으로 조작되었을 것이라는 의혹이 ‘강하게 (strongly suggest)’ 제기된다. (“Taken together the eforensics estimates and EFT and spikes tests exhibit anomalies that strongly suggest the Korea 2020 legislative election data were fraudulently manipulated.”, p. 18)

 

5. 이와 같은 통계적 분석 이후에는 반드시 추가적인 정보수집과 조사가 이루어져야 할 것이다. 왜냐하면 통계적 분석 결과만으로는 선거에서 실제로 무슨 일이 일어났는지에 대한 ‘결정적 증거(definitive evidence)’로 작용할 수 없기 때문이다.

 

[미세하게 달라진 수지/결과]

 

1. 부정투표 비율

 

(민주당 승리 지역구의 부정투표 비율)

 

사전투표: 43.1% -> 28.7%

 

당일투표(지역구): 3.14% -> 2.43%

 

당일투표(투표소): 0.925% -> 0.67%

 

재외투표: 0% -> 0.61%

 

(당 무관 당선자 지역구의 부정투표 비율)

 

사전투표: 22.6% -> 25.0%

 

당일투표(투표소): 0.92% -> 2.04%

 

당일투표(지역구): 2.09% -> 1.52%

 

재외투표: 0% -> 0%

 

2. 부정투표수

 

(민주당 승리 지역구)

 

부정투표수: 9.6% (1,030,562개의 표) -> 9.9% (1,418,079개의 표)

 

(당 무관 당선자 지역구)

 

부정투표수: 8.7% (1,105,458개의 표) -> 7.7% (1,234,217개의 표)

 

3. 부정투표에 의해 당선자가 뒤바뀌었다고 추정되는 지역구

 

(*필자주: 여기서 Mebane교수님은 부정투표에 의해 이득을 보게 된 것은 정당과 무관하게 승리한 지역구의 당선자라는 가정을 하고 있습니다. Mebane 교수님이 적용하고 계신 '반사실적 주론기법(counterfactual method)'은 이러한 가정을 바탕으로 '만약 선거부정이 없었다면' 투표결과가 어떻게 바뀌었을지 역으로 추정하는 것입니다. 따라서, 만약 부정투표에 의해 오직 하나의 정당만 (이를테면, 오직 민주당만) 이득을 봤다고 가정을 할 경우, 선거부정이 없었을 경우 어떻게 결과가 달라졌을지에 대한 추정은 달라집니다. 중요한 것은 어떠한 가정을 하는 지와는 무관하게, 통계모형 상으로는 부정투표가 분명히 감지되었다는 것이고, 이러한 부정투표가 과연 누구한테 유리하게 작용했는지는 어떤 가정을 받아들이냐에 따라 그 추정과 해석이 달라질 수 있다는 것입니다. 따라서, 부정투표에 의해 당선자가 뒤바뀐 것으로 추정되는 지역구들을 너무 곧이곧대로 받아들일 필요는 없습니다.)

 

27개 (민주당 14개, 통합당 11개, 무소속 2개) -> 22개 (민주당 15개, 통합당 7개)

 

(많은 공유 부탁드립니다.)

 

 

 

출처: 정훈 페이스북 2020.05.14

(일본 와세다대 준교수/부교수)

===============