통계학의 피카소는 누구일까

Tags:

“통계학의 피카소는 누구일까”라는 책을 우연히 알게되어 며칠동안 읽었습니다. 이 책은 저자의 말에 따르면 통계혁명 뒤에 자리한 핵심적인 생각들을 수학 기호를 사용하지 않고 쓴 책입니다.

이 책에는 칼 피어슨, 고셋, 피셔, 네이만, 이곤 피어슨, 콜모고로프, 튜키, 마할라노비스, 크레이머, 왈드, 코크란, 박스, 콕스, 튜키 등의 통계를 공부하다보면 한번 쯤은 봤을 이름들이 등장합니다. 그리고 이들의 연구들이 어떻게 진행되었고 누가 함께했고 누가 그 결론에 반대했는지, 부족한 부분들이 어떻게 채워졌는지가 설명됩니다. 피어슨의 기운 분포, 스튜던트의 t 검증, 신뢰구간, 중심극한정리, 실험 설계법, 비모수적 분석, 순차분석, 만-휘트니 비모수적 검증 등이 책에서 이야기된 주제 중 몇가지입니다.

개인적으로는 네이만의 신뢰구간에대한 “비율이 어떤 구간 내에 있을 확률이라니 이것이 진정 우리가 알고자하는 것입니까?” 라는 보울리의 비판과 네이만이 빈도론적 확률 정의를 채택해 신뢰수준의 의미를 정의하는 이야기가 재미있었습니다.

가장 마지막 챕터의 “실세계에서 확률은 어떤 의미인가”는 뜻밖의 흥미로운 이야기입니다. 내일 비 올 확률이 95퍼센트라고 예보할 때 95퍼센트의 확률은 무슨의미인가? 95%의 사람이 비를 맞는가, 모든 시간중 95%의 시간에서 비를 맞는가, 특정 지역의 95%에 비가 온다는 뜻인가 중 어느것인지를 물으면서 이에 대한 여러가지 답을 설명합니다. 그리고 ‘사람들은 정말 확률을 이해하고 있는가?’에 대한 질문을 던집니다.

똑똑한 사람들이 긴 시간동안 연구한 결과가 그렇다니까 그런가보다.. 하고 받아들였던 통계학의 문맥을 알게되는 좋은 책이었습니다. 통계학사의 전반부에서 후반부로오면서 서술의 농도가 옅어지는 단점은 있지만 통계학이 점점 더 복잡한 문제를 풀고 있는 이상 더 깊이있는 설명을 하는 것은 본래부터 어려운 것 아닐까하는 생각도 듭니다.

통계학을 좀 더 잘 이해하겠다고 통계학의 역사(origin of statistics)라는 책을 시도했다가 몇장 걷어보지도 못하고 포기했던 것을 생각하면 훨씬 읽어보기 쉬운 책입니다. 다만 통계학의 기본개념을 잘 모르시는 분들께는 재미없을수도. 저로서는 추천입니다.

아. 그런데 과연 통계학의 피카소는 누구일까요? 이건 책을 읽는 재미를 위해 남겨두겠습니다.