군집 분산이란 무엇입니까? (정의 & #038; 예)
통계에서 군집 분산은 단순히 두 개 이상의 군집 분산의 평균을 나타냅니다.
그룹 간의 공통 분산에 대한 단일 숫자를 얻기 위해 두 개 이상의 그룹 분산을 “풀링”한다는 의미로 “풀링됨”이라는 단어를 사용합니다.
실제로 합동 분산은 두 모집단의 평균이 같은지 여부를 확인하는 데 사용되는 2-표본 t-검정 에서 가장 자주 사용됩니다.
두 표본 간의 합동 분산은 일반적으로 sp 2 로 표시되며 다음과 같이 계산됩니다.
s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
두 표본 크기(n 1 및 n 2 )가 동일한 경우 공식은 다음과 같이 단순화됩니다.
s p 2 = (s 1 2 + s 2 2 ) / 2
군집화된 격차를 계산하는 시기
두 모집단 평균을 비교하려는 경우 잠재적으로 두 가지 통계 테스트를 사용할 수 있습니다.
1. 2-표본 t-검정 : 이 검정은 두 표본 간의 분산이 거의 같다고 가정합니다. 이 테스트를 사용하면 합동 분산을 계산합니다.
2. Welch의 t-검정 : 이 검정은 두 표본 간의 분산이 거의 동일하다고 가정하지 않습니다 . 이 테스트를 사용하면 합동 분산을 계산하지 않습니다 . 대신, 우리는 다른 공식을 사용합니다.
어떤 테스트를 사용할지 결정하기 위해 다음과 같은 경험 법칙을 사용합니다.
일반 규칙: 가장 큰 분산과 가장 작은 분산의 비율이 4보다 작으면 분산이 대략 같다고 가정하고 2-표본 t-검정을 사용할 수 있습니다.
예를 들어, 표본 1의 분산이 24.5이고 표본 2의 분산이 15.2라고 가정합니다. 가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 다음과 같이 계산됩니다.
비율: 24.5 / 15.2 = 1.61
이 비율이 4보다 작으므로 두 그룹 간의 차이가 거의 동일하다고 가정할 수 있습니다. 따라서 우리는 2-표본 t-검정을 사용합니다. 이는 합동 분산을 계산한다는 의미입니다.
그룹화된 편차 계산의 예
서로 다른 두 종의 거북이의 평균 무게가 같은지 여부를 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 다음 정보를 사용하여 각 개체군에서 무작위로 거북이 샘플을 수집합니다.
샘플 1:
- 표본 크기 n 1 = 40
- 표본 분산 s 1 2 = 18.5
샘플 2:
- 표본 크기 n 2 = 38
- 표본 분산 s 2 2 = 6.7
두 샘플 간의 통합 분산을 계산하는 방법은 다음과 같습니다.
- s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- s p 2 = ( (40-1)*18.5 + (38-1)*6.7 ) / (40+38-2)
- s p 2 = (39*18.5 + 37*6.7) / (76) = 12.755
합동 분산은 12,755 입니다.
합동 분산 값은 18.5와 6.7의 두 원래 분산 사이에 있습니다. 풀링된 분산이 두 표본 분산의 가중 평균이라는 점을 고려하면 이는 의미가 있습니다.
보너스 리소스: 이 합동 분산 계산기를 사용하면 두 샘플 간의 합동 분산을 자동으로 계산할 수 있습니다.