본문 바로가기

통계

[통계] 모수(parameter) vs. 통계량(statistic)

대통령 선거 결과가 궁금하다고 할 때,

투표를 한 모든 사람들의 집단은 모집단이 되고, 출구조사에서 선택된 사람들의 집단은 표본이 된다.

 

즉, 모집단은 내가 알고싶은 집단 전체를 의미하고, 표본은 모집단의 일부를 의미한다.

 

 

모집단이 갖는 평균, 분산 등의 특성을 모수(Parameter) 라고 하고,

표본이 갖는 특성을 통계량(Statistic) 이라 한다.

 

우리의 목표는, 우리가 갖고 있는 Samples의 통계량(Statistic)들을 바탕으로 모수(Parameter)를 추청하는 것이다.

 

 

자료가 퍼진 정도를 '분산'이라고 하는데, 모분산은 아래와 같이 구한다.

 

표본분산은 아래와 같이 구한다.

 

 

--------------------------------------------------------

 

N개의 sample이 있다고 할 때, 1번 sample, 2번 sample.......... N-1번 sample 까지는 아무 값이나 가져도 상관이 없지만,

마지막 N번의 sample은 앞서 구한 표본평균(Xbar)값을 만족하도록 해야하기 때문에 아무 값이나 가지면 안된다.

 

즉, 20명으로 이루어진 반 평균이 X점이라고 결정된 상황에서

1번 학생은 80점

2번 학생은 ?? 점

3번 학생은 ??? 점 등등 아무 점수나 받아도 상관 없지만,

마지막 20번 학생은 반 평균인 X점을 맞추기 위해 아무 값이나 가질 수가 없는 상황이다.

 

따라서 N이 아니라 N-1로 나누어주고, 여기서 'N-1'을 '자유도'라고 한다.

 

 

--------------------------------------------------------