히스토그램의 평균과 중앙값을 추정하는 방법
히스토그램은 데이터 세트의 값 분포를 시각화하는 데 도움이 되는 그래프입니다.
히스토그램의 x축은 데이터 값 그룹을 표시하고 y축은 각 그룹에 데이터 세트의 관측치가 몇 개 있는지 알려줍니다.
히스토그램은 분포를 시각화하는 데 유용하지만, 히스토그램만 보고 평균값 과 중앙값 을 아는 것이 항상 명확한 것은 아닙니다.
그리고 단순히 히스토그램을 보는 것만으로는 분포의 정확한 평균값과 중앙값을 찾을 수 없지만 두 값을 모두 추정하는 것은 가능합니다. 이 튜토리얼에서는 이를 수행하는 방법을 설명합니다.
히스토그램의 평균을 추정하는 방법
다음 공식을 사용하여 히스토그램 평균의 최상의 추정치를 찾을 수 있습니다.
평균의 최선 추정치: Σm i n i / N
금:
- m i : i 번째 bin의 중간
- n i : i 번째 bin의 빈도
- N: 전체 표본 크기
예를 들어 다음 히스토그램을 고려해보세요.
평균에 대한 최선의 추정치는 다음과 같습니다.
평균 = (5.5*2 + 15.5*7 + 25.5*10 + 35.5*3 + 45.5*1) / 23 = 22.89 .
히스토그램을 보면 이는 평균에 대한 합리적인 추정치인 것 같습니다.
히스토그램의 중앙값을 추정하는 방법
다음 공식을 사용하여 히스토그램의 중앙값에 대한 최상의 추정치를 찾을 수 있습니다.
중앙값의 최선 추정치: L + ((n/2 – F) / f) * w
금:
- L: 중간군의 하한값
- n: 총 관측치 수
- F: 중간그룹까지의 누적도수
- f: 중간 그룹의 빈도
- w: 중간 그룹의 너비
다시 한 번 다음 히스토그램을 고려해보세요.
중앙값에 대한 최선의 추정치는 다음과 같습니다.
중앙값 = 21 + ((25/2 – 9) / 10) * 9 = 24.15 .
히스토그램을 보면 이 역시 중앙값에 대한 합리적인 추정치인 것 같습니다.
관련 항목: 히스토그램의 표준 편차를 추정하는 방법
추가 리소스
줄기 및 잎 그림에서 평균, 중앙값 및 모드를 찾는 방법
빈도표에서 평균을 계산하는 방법
평균과 중앙값을 사용해야 하는 경우