표본 분산 대 인구 차이: 차이점은 무엇입니까?

에 의해 벤자민 앤더슨 7월 23, 2023 가이드 댓글 0개

분산은 데이터 세트의 값 분포를 측정하는 방법입니다.

모집단 분산을 계산하는 공식은 다음과 같습니다.

σ ² = Σ ( _xi – μ) ² / N

금:

표본 분산을 계산하는 공식은 다음과 같습니다.

s ² = Σ (x _i – x ) ² / (n-1)

금:

두 공식 사이에는 아주 작은 차이만 있습니다.

모집단 분산을 계산할 때 N (모집단의 크기)으로 나눕니다.

표본 분산을 계산할 때 n-1 (표본 크기 – 1)로 나눕니다.

표본 분산을 계산할 때 n-1로 나누는 베셀 보정(Bessel Correction) 을 적용합니다.

수학적 세부 사항에 얽매이지 않고 n-1로 나누면 모집단 분산에 대한 편견 없는 추정치를 제공할 수 있습니다. 이는 어쨌든 우리가 일반적으로 관심을 갖는 값입니다.

표본 분산을 계산할지 모집단 분산을 계산할지 확실하지 않은 경우 다음 일반 규칙을 염두에 두세요.

작업 중인 데이터 세트가 더 큰 관심 모집단에서 가져온 표본을 나타낼 때 표본 분산을 계산해야 합니다.

작업 중인 데이터 세트가 전체 모집단, 즉 관심 있는 모든 값을 나타낼 때 모집단 분산을 계산해야 합니다.

다음 예에서는 표본 분산과 모집단 분산을 계산하는 다양한 시나리오를 보여줍니다.

식물학자가 특정 식물종의 높이 변화를 계산하려고 한다고 가정해 보겠습니다. 한 지역에 수천 개의 개별 식물이 있기 때문에 그녀는 20개 식물의 단순 무작위 표본을 추출하여 각각의 높이를 측정하기로 결정했습니다.

이 시나리오에서 식물학자는 전체 식물 집단의 분산에 관심이 있지만 단순히 이 표본을 사용하여 실제 집단 분산을 추정하기 때문에 표본 분산을 계산해야 합니다.

교사가 학급 학생 20명의 시험 점수 분산을 계산하려고 한다고 가정합니다.

이 시나리오에서 교사는 모집단 분산을 계산해야 합니다. 왜냐하면 교사가 작업 중인 데이터 세트(20개 시험 결과)가 관심 모집단 전체를 나타내기 때문입니다.

다음 자습서에서는 다양한 통계 소프트웨어에서 표본 분산과 모집단 분산을 계산하는 방법을 설명합니다.

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기