티스토리 뷰


통계학적 사고 (On Statistical Thinking)


통계학적 사고란 정성적 사고를 하는 것이 아니라 정량적 사고를 하는 것이라 할 수 있을 것입니다. 좀 더 엄밀하게 말하자면, 통계학적으로 사고한다는 것의 본질은 확률을 의식하면서 사고한다는 것입니다. 예를들어 내일 비가 올것인가 안올 것인가에 관심이 있다고 합시다. 이 경우 내일 비가 온다 안온다 이런 예측을 할때 확률을 생각하는 것은 상당히 자연스러운 개념입니다. 왜냐하면 비가 오거나 안오거나 둘중의 하나이지만 그 두 가능성의 정도가 같지 않을수 있기 때문입니다. 즉, 가능성(possibility)와 개연성(probability)을 구분하는 것이 통계학적 사고의 첫걸음 입니다.


만약 기존의 아무 정보가 없다면 내일 비가 오거나 내일 비가 오지 않는 것은 반반의 확률을 가질수 있습니다. 그런데 과거 자료를 살펴보니 일년에 평균 며칠 비가 왔었더라 하는 정보가 있다면 그 정보를 반영해서 확률이 바뀔수 있겠지요. 예를 들어, 그 지역에 365일중에 100일 정도 비가 왔었더라면 내일 비가 올 확률은 100/365 가 되는 것입니다. 그런데 만약 그러한 정보 외에 기압, 온도 이런 정보가 더 있고 그때의 강수량에 대한 기록이 있다면 그걸 바탕으로 내일 비가 올 확률이 더 업데이트 될 수 있겠지요. 이렇게 특정 기압과 특정 온도에서의 비가 오는 것에 대한 확률처럼 주어진 특정 조건 하에서 관심 사건이 일어날 확률을 조건부 확률(conditional probability)이라고 부릅니다. 많은 과학적 발견이 사실은 조건부 확률의 형태로 표현되는 것입니다. 어떤 사건에 대한 조건부 확률이 1이 되면 그것은 법칙이라고도 부릅니다.


특정 조건 하에서 그 사건이 일어날 확률을 계산하기 위해서는 모형이 있어야 하고 데이타로부터 그 모형의 모수를 추정할 수 있어야 합니다. 따라서 정확하고 의미있는 확률 계산을 위해서는 모형이 좋아야 하고 또 데이터가 신뢰할 수 있어야 하며 모수 추정 방법론이 적절해야 합니다. 이렇게 모형을 세우고 자료를 수집하고 모수를 추정하는 방법을 연구하는 분야가 통계학입니다.


그런면에서 오십보백보라는 표현은 상당히 반-통계학적 표현입니다. 50보를 도망간 병사나 100보를 도망간 병사나 다 나쁜 놈이라는 의미인데 옛날에는 맞을지 몰라도 통계학자의 시각으로는 동의하기 어려운 말입니다. 사실 통계학자는 0과 1사이에 위치한 여러 확률값을 가지고 서로 비교를 하며 살아갑니다. 흰색과 검은색 사이에 수많은 종류의 회색이 있는 것처럼, 우리 앞에 나타나는 미래는 어느 정도의 흰색과 어느 정도의 검은색을 포함한 채로 등장하기 마련입니다. 어느 사람에 대한 판단도 마찬가지이지요. 선거의 경우에, 어떤 후보가 다른 후보보다 더 좋은 사람이거나 아니면 더 나쁜 사람이거나 둘중 하나일 지라도 우리는 그 사람에 대해 제한된 관측을 하기 때문에 좋은 사람일 가능성과 나쁜 사람일 가능성을 다 포함한 채로 투표장에 나서게 됩니다.


조건부 확률은 이러한 불확실성을 확률이라는 숫자로 표현해 줌으로써 비교를 가능케 하고 따라서 보다 나은 선택을 할 수 있게 해주는 훌륭한 도구입니다. 신이 내린 "불확실성"이라는 저주를 풀어내는 열쇠가 바로 확률인 것입니다. 이러한 확률을 제대로 계산해 내는것은 인간이 취할수 있는 최선의 선택인 것입니다. 현명한 재판관이라면 50보를 도망간 병사보다는 100 보를 도망간 병사에게 더 큰 형벌을 내려야 할 것입니다. 이제 곧 다가올 선거에서도, 여당도 나쁘고 야당도 나쁘다고 싸잡아 비난할께 아니라, 누가 더 나쁜지 현명한 재판관의 지혜를 발휘하는 것이 필요하지 않을까 생각해 봅니다.