코딩하면서 늦은 어제자 JTBC 뉴스를 시청하고 있는데, "집회 참가자가 경찰 추산과 주최측 추산이 왜 다른가?" 하면서, 학자들이 나름대로의 방식대로 계산한 다른 방식들도 소개해주는 것이 나왔다.
(페이스북에서 봤던 박인규 교수님의 추산법도 나왔다. 컴퓨터 비전 활용의 올바른 예.)
.
여기에서는 유동인구를 합하느냐 안하느냐, 합할거면 어떻게 합할거냐 하는 이슈가 있긴 했다만,
어쨌든 이 모든 방식이 전부 정확하지는 않을 것이다.
.
1.
각종 통계적 방법론을 이용하여 분석을 진행하더라도, 점추정만 하기 보다는 신뢰구간을 함께 구하고, 비슷한 여러 방법이 있다면 그 방법을 다 적용해본 후 결과를 비교해보기도 한다.
집회 참가자의 고정인구만 가지고 보는 것도 의미가 있을 수 있고, 유동인구도 고려해야한다는 의견도 의미가 있을 수 있기 때문에, 경찰이 추산한 값이 너무 낮다고 해서 비판할 것도 아니고, 높게 추산한 다른 방법들 중 뭐가 더 정확하다고 쉽게 이야기하기도 아직 어렵다고 생각한다. 그냥 그 범주 안에 있다는 것만 이야기하면 될 것 같다.
.
2.
그래도 2002년 월드컵 때 추산 인원은 135만명, 2009년 노무현 대통령 영결식은 15만명, 이번 집회 22만명으로 추정량이 계속 바뀌는건, 지적받을 만한 것 같다.
(이 블로그 보니까, 고무줄 추정량이었다고 하더라. http://m.blog.daum.net/migong1/15867728)
주최측이 추정한 통계량의 분산이 Var(주최), 경찰이 추정한 통계량의 분산이 Var(경찰)이라고 할 때
이 두 추정량들의 분산비 Var(주최) / Var(경찰) 를 구하였을 때, 이 값이 1보다 크면, 경찰이 구한 추정량이 더 효율적이라고 이야기할 수 있다.
그런데 경찰의 고무줄 추정이 지적되고 있는 정도면, 주최측에 비해 효율적이라고 이야기하기 어려울 여지가 큰 것 같다.
즉, 좋은 통게량의 조건 중 하나가 효율성이며, 경찰의 추정량은 분산이 크기 때문에 좋은 추정량이 아니라고 얘기할 수 있다고 생각한다.
.
근데 실제로 유동인구와 고정인구의 차이가 각 집회마다 차이가 큰 상황이었다면 얘기가 달라질 수도 있다. (다시 말해, 유동인구를 고려하는 방법이냐 아니냐 하는 차이가 있기 때문에, 효율성을 비교하는게 애초부터 fair하지 않다.)
정말로 월드컵 응원 때는 백몇만명이 거의 처음부터 끝까지 자리를 지키는 편이었고, 이번 촛불시위 때는 20여만명은 거의 처음부터 끝까지 자리를 지켰지만 나머지는 왔다갔다를 많이 했다면, 경찰의 추산도 나름 효율적인게 될 수도 있다. 난 이에 대한 정확한 값은 모르기 떄문에 이에 대해서는 걍 분석을 못하겠다. :P 데이터도 없고 배경지식도 없기 때문에 분석을 못한다.
.
아이 복잡해.

+ Recent posts