군집 분산이란 무엇입니까? (정의 & #038; 예)

에 의해 벤자민 앤더슨 7월 26, 2023 가이드 댓글 0개

통계에서 군집 분산은 단순히 두 개 이상의 군집 분산의 평균을 나타냅니다.

그룹 간의 공통 분산에 대한 단일 숫자를 얻기 위해 두 개 이상의 그룹 분산을 “풀링”한다는 의미로 “풀링됨”이라는 단어를 사용합니다.

실제로 합동 분산은 두 모집단의 평균이 같은지 여부를 확인하는 데 사용되는 2-표본 t-검정 에서 가장 자주 사용됩니다.

두 표본 간의 합동 분산은 일반적으로 _sp ² 로 표시되며 다음과 같이 계산됩니다.

s _p ² = ((n ₁ -1)s ₁ ² + (n ₂ -1)s ₂ ² ) / (n ₁ +n ₂ -2)

두 표본 크기(n ₁ 및 n ₂ )가 동일한 경우 공식은 다음과 같이 단순화됩니다.

s _p ² = (s ₁ ² + s ₂ ² ) / 2

두 모집단 평균을 비교하려는 경우 잠재적으로 두 가지 통계 테스트를 사용할 수 있습니다.

1. 2-표본 t-검정 : 이 검정은 두 표본 간의 분산이 거의 같다고 가정합니다. 이 테스트를 사용하면 합동 분산을 계산합니다.

2. Welch의 t-검정 : 이 검정은 두 표본 간의 분산이 거의 동일하다고 가정하지 않습니다 . 이 테스트를 사용하면 합동 분산을 계산하지 않습니다 . 대신, 우리는 다른 공식을 사용합니다.

어떤 테스트를 사용할지 결정하기 위해 다음과 같은 경험 법칙을 사용합니다.

일반 규칙: 가장 큰 분산과 가장 작은 분산의 비율이 4보다 작으면 분산이 대략 같다고 가정하고 2-표본 t-검정을 사용할 수 있습니다.

예를 들어, 표본 1의 분산이 24.5이고 표본 2의 분산이 15.2라고 가정합니다. 가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 다음과 같이 계산됩니다.

비율: 24.5 / 15.2 = 1.61

이 비율이 4보다 작으므로 두 그룹 간의 차이가 거의 동일하다고 가정할 수 있습니다. 따라서 우리는 2-표본 t-검정을 사용합니다. 이는 합동 분산을 계산한다는 의미입니다.

서로 다른 두 종의 거북이의 평균 무게가 같은지 여부를 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 다음 정보를 사용하여 각 개체군에서 무작위로 거북이 샘플을 수집합니다.

샘플 1:

샘플 2:

두 샘플 간의 통합 분산을 계산하는 방법은 다음과 같습니다.

합동 분산은 12,755 입니다.

합동 분산 값은 18.5와 6.7의 두 원래 분산 사이에 있습니다. 풀링된 분산이 두 표본 분산의 가중 평균이라는 점을 고려하면 이는 의미가 있습니다.

보너스 리소스: 이 합동 분산 계산기를 사용하면 두 샘플 간의 합동 분산을 자동으로 계산할 수 있습니다.

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기