[업무에 날개를 달아주는 통계] 2
본 글은 2019년 3월 28일 직원 필진 프로그램인 '한양브릿지'를 통해 작성된 글이며, 기존 작성글을 이관한 것임을 밝힙니다.
# 통계 배워서 뭐하려고?

통계 이야기를 할 때 빼놓을 수 없는 영화가 있는데 바로 'Money Ball'입니다. 야구를 좋아하시는 분들이라면 이미 보셨을지 모르겠네요. 이 영화는 가난한 메이저리그 야구 구단인 오클랜드 애슬래틱스가 메이저리그 사상 처음으로 20연승을 거두게 되는 이야기를 감동적으로 보여줍니다. 애슬래틱스의 단장 빌리 빈은 적은 비용으로 최대의 효과를 거두기 위해 과감하게 기존의 통념을 버리고 데이터와 통계를 기반으로 출루율과 장타율이 좋은 저평가된 선수들을 발굴해 냅니다. 이러한 빈의 전략은 시즌 후반부로 갈수록 빛을 발하게 되고 결국 최다 연승 신기록을 세우게 되죠. 비록 통계로 분석하는 장면은 잠깐 스쳐 지나가는 정도로 나오긴 해도 통계가 가진 힘이 무엇인지 잘 보여주는 영화입니다.
그런데 이게 다가 아닙니다. 요즘 소위 4차 산업혁명과 관련하여 '데이터 사이언스', '빅데이터', '머신러닝(기계학습)', '인공지능' 등의 이야기들을 많이 하는데 이러한 영역에서도 통계는 빠질 수 없습니다.

굳이 이런 도표를 보지 않더라도 'Tensor Flow'(알파고 때문에 유명해진 구글의 머신러닝 라이브러리) 같은 걸 배우려다 보면 수학과 통계학적 지식이 중요하다는 것을 금방 경험하실 수 있습니다. 데이터를 기반으로 하는 새로운 시대를 맞이하여 통계학적 방법론을 이해할 정도의 지식을 갖춰두는 건 적어도 손해볼 일이 아닐 겁니다.
# 기술통계, 추론통계
교직원으로 입사하고 제가 처음 맡았던 일은 '입학 홍보' 업무였습니다. 고등학교에 방문해서 학교를 홍보할 자료를 만들다 보니 자연스럽게 우리 대학의 통계 자료도 찾아보게 되었습니다. 두꺼운 대학 통계연보를 넘기며 우리 대학의 장점을 알릴 수 있는 지표를 찾기 위해 고민했던 기억이 아직도 생생합니다. 아무튼 당시에는 '통계'라고 하면 통계연보라는 두꺼운 책만 떠올렸던 것 같습니다. 요즘에는 학교 홈페이지에 게시된 대학정보공시나 대학알리미 사이트를 통해 우리 대학뿐 아니라 다른 대학의 통계도 쉽게 찾아볼 수 있게 되었습니다.

통계연보나 대학정보공시에서 볼 수 있는 통계를 통계학에서는 '기술통계 (Descriptive Statistics)'라고 합니다. 기술통계는 수집된 자료를 정리하거나 요약하여 자료의 특성이 무엇인지 설명해주는 통계입니다. 표나 그림을 통해 설명할 수도 있고 평균, 분산 등을 구해 요약된 정보를 제공할 수도 있습니다.
그럼 여기서 한 단계 더 나아가보겠습니다. 예를들어 'A'라는 교육 프로그램에 대해 100명의 학생들에게 5점 척도로 만족도 조사를 해보았더니 5점 만점을 준 학생은 60명, 4점을 준 학생은 30명, 3점을 준 학생은 10명이었습니다. 이 결과를 요약해서 표로 보여주거나 평균값, 최대값, 최소값 등을 구해보는 것은 기술통계에 해당됩니다. 그런데 100명을 조사한 결과로 우리 대학의 모든 학생들의 만족도를 추정해 볼 수도 있습니다. 이를 통계학에서는 추론통계(Inferential Statistics)라고 합니다. 추론통계를 통해서 모집단의 특성을 추정해 보거나 앞으로 일어날 일을 예측해 볼 수 있다면 업무를 하는 데에도 큰 도움이 될 수 있겠죠. '업무에 날개를 달아주는 통계' 시리즈를 통해 기술통계부터 추론통계까지 차근차근 다뤄볼 계획이니 많은 관심과 흥미를 갖고 지켜봐 주시기 바랍니다.
