표본 분산 대 인구 차이: 차이점은 무엇입니까?


분산은 데이터 세트의 값 분포를 측정하는 방법입니다.

모집단 분산을 계산하는 공식은 다음과 같습니다.

σ 2 = Σ ( xi – μ) 2 / N

금:

  • Σ : 합계를 뜻하는 기호
  • μ : 인구 평균
  • x i : 모집단의 i 번째 요소
  • N : 인구 규모

표본 분산을 계산하는 공식은 다음과 같습니다.

s 2 = Σ (x ix ) 2 / (n-1)

금:

  • x : 표본 평균
  • x i : 샘플의 i 번째 요소
  • n : 표본 크기

두 공식 사이에는 아주 작은 차이만 있습니다.

모집단 분산을 계산할 때 N (모집단의 크기)으로 나눕니다.

표본 분산을 계산할 때 n-1 (표본 크기 – 1)로 나눕니다.

표본 분산을 계산할 때 n-1로 나누는 베셀 보정(Bessel Correction) 을 적용합니다.

수학적 세부 사항에 얽매이지 않고 n-1로 나누면 모집단 분산에 대한 편견 없는 추정치를 제공할 수 있습니다. 이는 어쨌든 우리가 일반적으로 관심을 갖는 값입니다.

표본 분산과 모집단 분산을 계산하는 경우

표본 분산을 계산할지 모집단 분산을 계산할지 확실하지 않은 경우 다음 일반 규칙을 염두에 두세요.

작업 중인 데이터 세트가 더 큰 관심 모집단에서 가져온 표본을 나타낼 때 표본 분산을 계산해야 합니다.

작업 중인 데이터 세트가 전체 모집단, 즉 관심 있는 모든 값을 나타낼 때 모집단 분산을 계산해야 합니다.

다음 예에서는 표본 분산과 모집단 분산을 계산하는 다양한 시나리오를 보여줍니다.

예: 표본 분산 계산

식물학자가 특정 식물종의 높이 변화를 계산하려고 한다고 가정해 보겠습니다. 한 지역에 수천 개의 개별 식물이 있기 때문에 그녀는 20개 식물의 단순 무작위 표본을 추출하여 각각의 높이를 측정하기로 결정했습니다.

이 시나리오에서 식물학자는 전체 식물 집단의 분산에 관심이 있지만 단순히 이 표본을 사용하여 실제 집단 분산을 추정하기 때문에 표본 분산을 계산해야 합니다.

예: 모집단 분산 계산

교사가 학급 학생 20명의 시험 점수 분산을 계산하려고 한다고 가정합니다.

이 시나리오에서 교사는 모집단 분산을 계산해야 합니다. 왜냐하면 교사가 작업 중인 데이터 세트(20개 시험 결과)가 관심 모집단 전체를 나타내기 때문입니다.

추가 리소스

다음 자습서에서는 다양한 통계 소프트웨어에서 표본 분산과 모집단 분산을 계산하는 방법을 설명합니다.

Excel에서 표본 및 모집단 분산을 계산하는 방법
R에서 표본 및 모집단 분산을 계산하는 방법
Python에서 표본 및 모집단 분산을 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다