다음과 같은 자료가 있다.
0.07 0.07 0.12 0.95 0.35 0.13 0.06 0.72 0.13 0.17 0.15
0.27 0.38 0.09 0.06 0.58 0.31 0.12 0.86 0.05 0.06 0.20
0.39 0.12 0.07 0.14 1.13 0.10 0.15 0.20 0.05 0.22 0.10
0.10 0.19 2.40 0.57 0.11 0.40 0.50 0.14 0.12 0.08 0.29
0.09 2.70 0.12 0.11 0.05 0.22 0.10
엑셀로 위 자료의 도수분포표와 히스토그램을 그리려고 한다.
1. 도수 분포표 만들기
먼저,
도수분포표란, 자료를 일정 그룹으로 나눠 그룹에 속하는 데이터가 얼마나 되는지 보는 표이다.
아래 표는 기상청에서 제공하는「지진및지진해일발생통계」의 일부이다.
표를 보면 리히터규모별로 / 또 남북별로 지진이 얼마나 발생했는지 알 수 있다.
자료를 리히터규모별로 나누는데 주목해보자.
1열 (맨 왼쪽 세로줄) 을 보면, 리히터를 규모별로 나누어 놓았다.
그리고, 해당 리히터 규모에 따라 지진 발생 횟수를 정리해 놓았다.
이렇게 정리한 표를 도수분포표라고 한다.
그렇다면 궁금증이 생긴다.
그룹을 몇 개로 나눠야 하는가?

일반적으로 그룹은 5개 ~ 15개 정도로 나눈다.
하지만 꼭 따를 필요는 없고, 분포를 잘 나타낼 수 있는 그룹 수로 정하면 된다.
그렇다면 위의 자료로 도수분포표를 그려보도록 하자.
(1) 먼저 엑셀에 자료를 입력한다.
- 엑셀의 A열에 세로로 자료를 쭉 입력하니 A51까지 입력이 되었다.
(2) 자료의 최대값과 최소값을 확인해본다. (구간을 정해야 하기 때문에 자료의 범위가 어떻게 되는지 먼저 봐야겠지?)
- 최대값과 최소값을 구할 때는 MAX 함수와 MIN 함수를 사용한다. (아래 E열 참조)
(3) FREQUENCY 함수를 이용해 도수를 구한다.
- 최대값과 최소값을 기준으로, 나는 12개의 계급구간으로 나누었다.
- 도수를 입력할 셀을 선택(드래그)한 뒤, 선택한 상태에서 =FREQUENCY( ) 함수 입력한다.
도수를 입력할 셀을 모두 선택(드래그)하고, 그 상태에서 다른거 아무것도 하지 말고 바로 키보드로 =FREQUENCY( ) 입력을 하는 것이 포인트!
=FREQUENCY(데이터범위, 계급범위의 끝값LIST) 을 입력하고, Ctrl + Shift + Enter 키를 같이 누른다.
그럼 선택(드래그)한 셀 안이 도수로 채워지는 것을 확인할 수 있다.
(4) 셀 마지막에 합계 행을 추가해 깔끔하게 정리한다.
잘 안되거나, 어떻게 하는지 아직 모르겠으면 아래 유튜브 참고!
https://www.youtube.com/watch?v=51IyO7O2nE0
2. 히스토그램 그리기
계급과 빈도수를 구간설정(드래그)하면, 오른쪽 아래에 아이콘이 나타나는데, 이 아이콘을 클릭하면 아래 그림과 같이 나타난다. 여기서 차트(C)의 묶은 세로 막대형을 클릭한다.
또는, 계급과 빈도수를 구간설정(드래그)한 뒤 삽입 → 차트 → 2차원 세로 막대형 → 묶은 세로 막대형 클릭한다.
막대그래프를 클릭하거나, 막대그래프를 클릭한 뒤 마우스 우클릭하면 [데이터 계열 서식]이 나온다.
데이터 계열 서식에서 간격너비를 조정해준다.
끝!
'통계' 카테고리의 다른 글
[통계]t 분포(표) (1) | 2022.12.09 |
---|---|
[통계] 엑셀로 줄기-잎 그림/사분위수 구하기/IQR/상자그림(BOX PLOT) 그리기 (0) | 2022.09.23 |
[통계] 모수(parameter) vs. 통계량(statistic) (0) | 2022.09.01 |