그룹화된 데이터의 분산을 찾는 방법(예제 포함)


우리는 종종 그룹화된 빈도 분포의 분산을 계산하려고 합니다.

예를 들어 다음과 같은 그룹화된 빈도 분포가 있다고 가정합니다.

원시 데이터 값을 모르기 때문에 정확한 분산을 계산할 수는 없지만 다음 공식을 사용하여 분산을 추정하는 것은 가능합니다.

분산: Σn i ( mi -μ) 2 / (N-1)

금:

  • n i : i 번째 그룹의 주파수
  • mi : i 번째 그룹의 중간
  • μ : 평균
  • N: 전체 표본 크기

참고: 각 그룹의 중간점 은 범위의 하한값과 상한값을 평균하여 구할 수 있습니다. 예를 들어 첫 번째 그룹의 중간점은 (1+10) / 2 = 5.5로 계산됩니다.

다음 예에서는 이 수식을 실제로 사용하는 방법을 보여줍니다.

예: 그룹화된 데이터의 분산 계산

다음과 같이 그룹화된 데이터가 있다고 가정합니다.

그룹화된 데이터의 분산을 계산하기 위해 앞서 언급한 공식을 사용하는 방법은 다음과 같습니다.

그룹화된 데이터의 차이

그러면 다음과 같이 분산을 계산합니다.

  • 분산: Σn i ( mi -μ) 2 / (N-1)
  • 차이 : (604.82 + 382.28 + 68.12 + 477.04 + 511.21) / (23-1)
  • 차이 : 92.885

데이터세트의 분산은 92.885 로 나타났습니다.

추가 리소스

다음 튜토리얼에서는 그룹화된 데이터에 대한 다른 측정항목을 계산하는 방법을 설명합니다.

그룹화된 데이터의 평균과 표준편차를 찾는 방법
그룹화된 데이터의 백분위수 순위를 계산하는 방법
그룹화된 데이터의 중앙값을 찾는 방법
그룹화된 데이터 모드를 찾는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다