히스토그램의 표준편차를 추정하는 방법
히스토그램은 데이터 세트의 값 분포를 시각화하는 유용한 방법을 제공합니다.
히스토그램의 x축은 데이터 값 그룹을 표시하고 y축은 각 그룹에 데이터 세트의 관측치가 몇 개 있는지 알려줍니다.

히스토그램은 관측치를 빈에 넣기 때문에 히스토그램이 나타내는 데이터 세트의 정확한 표준편차를 계산할 수는 없지만 표준편차를 추정하는 것은 가능합니다.
다음 예에서는 이를 수행하는 방법을 보여줍니다.
관련 항목: 히스토그램의 평균과 중앙값을 추정하는 방법
히스토그램의 표준편차를 추정하는 방법
히스토그램의 표준편차를 추정하려면 먼저 평균을 추정해야 합니다.
다음 공식을 사용하여 평균을 추정할 수 있습니다.
평균: Σm i n i / N
금:
- m i : i 번째 bin의 중간
- n i : i 번째 bin의 빈도
- N: 전체 표본 크기
예를 들어 다음과 같은 히스토그램이 있다고 가정해 보겠습니다.

이 히스토그램의 평균값을 추정하는 방법은 다음과 같습니다.

우리는 평균을 22.89 로 추정합니다.
참고: 각 그룹의 중간점 은 범위의 하한값과 상한값을 평균하여 구할 수 있습니다. 예를 들어 첫 번째 그룹의 중간점은 (1+10) / 2 = 5.5로 계산됩니다.
이제 평균을 추정했으므로 다음 공식을 사용하여 표준편차를 추정할 수 있습니다.
표준편차: √ Σn i (mi -μ ) 2 / (N-1)
금:
- n i : i 번째 bin의 빈도
- m i : i 번째 bin의 중간
- μ : 평균
- N: 전체 표본 크기
이 공식을 데이터세트에 적용하는 방법은 다음과 같습니다.
데이터세트의 표준편차는 9.6377 로 추정됩니다.
데이터세트의 표준편차와 정확히 일치한다고 보장할 수는 없지만(데이터세트의 원시 데이터 값을 모르기 때문에) 이는 표준편차에 대한 최선의 추정치를 나타냅니다.
추가 리소스
다음 튜토리얼에서는 그룹으로 그룹화된 데이터와 관련된 기타 일반적인 작업을 수행하는 방법을 설명합니다.