一萬書庫

통계적 사고 = 합리적 사고 본문

2021

통계적 사고 = 합리적 사고

Power Reviewer 2021. 11. 2. 14:31

 

 

 

3일 만에 끝내는 코딩 통계 - R언어 설치부터 코딩까지

_박준석 / 사회평론아카데미

 

 

 

1.

며칠 전 동네 마트에서 물건을 몇 개 고른 후, 캐시어 앞에 섰다. 내가 구입한 물건들의 바코드가 읽히던 중, 내 앞에서 계산을 마치고 나갔던 한 사나이가 다시 튀어 들어왔다. 계산이 틀렸단다. 캐시어의 응답이 기가 막혔다. 사람이 한 것(계산)이 아니라 컴퓨터가 했는데, 틀릴 리가 없지 않느냐며 짜증 섞인 목소리로 응대했다. 이 캐시어에겐 두 가지 문제점이 있다. 고객이 어느 부분에서 계산이 잘못되었냐고 먼저 물어보고 확인했어야 했다. 그리고 컴퓨터는 완전무결하다는 식으로 이야기하면 안 된다. 인풋이 안 좋으면, 아웃풋도 안 좋다. (그 고객의 영수증엔 여러 품목 중 한 품목의 단일 값만 입력이 되어있었고, 실제로는 물품이 2개였다. 그러니까 기입된 금액만 보고 대충 계산했을 때 합계가 안 맞은 것이다. 캐시어의 잘못도 컴퓨터의 잘못도 아니었지만, 영수증에 그렇게 기재되는 것은 시정해야할 만한 일이라고 생각했다).

 

2.

요즘은 초등학생들도 코딩을 배운다. 코딩과 데이터과학이 대세이다. 인풋의 질을 높이는 과정들이다. 이 책의 저자 박준석은 인문학(심리학)에서 학사, 석사 학위를 취득 후 통계학과 계량심리학으로 방향전환을 한 데이터 과학자이다. 저자가 이 책을 쓰게 된 동기는 현행 고교 통계 교과 과정에 대한 불만에서 시작되었다고 한다. 수식으로만 가득 차 있는 반면 통계학의 근본 철학이나 데이터분석과는 거리가 먼 확률과 통계교육과정의 문제점을 보완하기 위해 이 책을 썼다고 한다.

 

3.

굳이 데이터분석을 업으로 하지 않더라도 현대사회에서 발생하는 문제들은 점점 더 확률과 통계학적 사고 능력을 필요로 하는 경우가 많아지고 있다. 저자는 이 책을 쓰기 시작할 때는 고등학생들을 염두에 두었지만, 통계학에 관심을 갖거나 다시 익히고 싶은 성인들을 위해서도 도움이 되기를 바란다고 한다. 프로그래밍 언어인 R부터 시작한다. R 언어는 통계 및 데이터분석을 위해 특화된 프로그래밍 언어이다. 처음부터 통계학자들이 개발과정에 적극적으로 참여했다고 한다. 프로그래밍 R을 설치하는 과정이 친절하게 제시된다.

 

4.

본론으로 들어서면, 코딩으로 확률과 통계 시작하기, 프로그래밍으로 확률과 통계를 공부하는 이유, 확률과 조건부확률, 확률분포, 통계적 추정 등을 거쳐 통계학에 좀 더 관심이 있는 사람들을 위한 통계학의 지도로 마무리 된다.

 

5.

확률은 어찌 보면 경우의 수를 약간 확장한 것에 지나지 않습니다. 생각할 수 있는 모든 경우의 수 중에서 우리가 관심을 갖는 경우의 수가 차지하는 비율을 생각하는 것이기 때문입니다. 그러므로 경우의 수 계산만 잘하면 확률계산은 식은 죽 먹기입니다.” 수학적 확률의 개념은 무엇인가? 가능한 모든 경우 중 관심 있는 경우의 비율이 얼마냐 하는 것이다. 그렇다면 통계적 확률은 무엇인가? 통계적 확률은 수학적 확률에 비해 더 구체적이다. 통계적 확률은 전체 시행 횟수 중 특정 사건이 일어난 횟수의 비율이다. 각 챕터 끝에 부록처럼 붙어 있는 글들인 심슨의 역설’, ‘생일 역설’, ‘아들/딸 역설’, ‘예측정확도의 역설등도 흥미롭게 읽을거리다. 통계적 사고는 합리적 사고와 맞물리기 때문에 확률과 통계학적 사고 능력의 향상을 위해 읽어볼만한 책이다.

 

 

 

 

'2021' 카테고리의 다른 글

내가 쓴 글들이 책이 된다  (0) 2021.11.04
마음보다 몸이 우선이다  (0) 2021.11.03
돈을 목적으로 살아간다는 것  (1) 2021.10.28
팬데믹 시대, 소시오패스를 조심하라?  (0) 2021.10.27
자기인식이 우선이다  (0) 2021.10.26