군집 분산이란 무엇입니까? (정의 & #038; 예)


통계에서 군집 분산은 단순히 두 개 이상의 군집 분산의 평균을 나타냅니다.

그룹 간의 공통 분산에 대한 단일 숫자를 얻기 위해 두 개 이상의 그룹 분산을 “풀링”한다는 의미로 “풀링됨”이라는 단어를 사용합니다.

실제로 합동 분산은 두 모집단의 평균이 같은지 여부를 확인하는 데 사용되는 2-표본 t-검정 에서 가장 자주 사용됩니다.

두 표본 간의 합동 분산은 일반적으로 sp 2 로 표시되며 다음과 같이 계산됩니다.

s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)

두 표본 크기(n 1 및 n 2 )가 동일한 경우 공식은 다음과 같이 단순화됩니다.

s p 2 = (s 1 2 + s 2 2 ) / 2

군집화된 격차를 계산하는 시기

두 모집단 평균을 비교하려는 경우 잠재적으로 두 가지 통계 테스트를 사용할 수 있습니다.

1. 2-표본 t-검정 : 이 검정은 두 표본 간의 분산이 거의 같다고 가정합니다. 이 테스트를 사용하면 합동 분산을 계산합니다.

2. Welch의 t-검정 : 이 검정은 두 표본 간의 분산이 거의 동일하다고 가정하지 않습니다 . 이 테스트를 사용하면 합동 분산을 계산하지 않습니다 . 대신, 우리는 다른 공식을 사용합니다.

어떤 테스트를 사용할지 결정하기 위해 다음과 같은 경험 법칙을 사용합니다.

일반 규칙: 가장 큰 분산과 가장 작은 분산의 비율이 4보다 작으면 분산이 대략 같다고 가정하고 2-표본 t-검정을 사용할 수 있습니다.

예를 들어, 표본 1의 분산이 24.5이고 표본 2의 분산이 15.2라고 가정합니다. 가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 다음과 같이 계산됩니다.

비율: 24.5 / 15.2 = 1.61

이 비율이 4보다 작으므로 두 그룹 간의 차이가 거의 동일하다고 가정할 수 있습니다. 따라서 우리는 2-표본 t-검정을 사용합니다. 이는 합동 분산을 계산한다는 의미입니다.

그룹화된 편차 계산의 예

서로 다른 두 종의 거북이의 평균 무게가 같은지 여부를 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 우리는 다음 정보를 사용하여 각 개체군에서 무작위로 거북이 샘플을 수집합니다.

샘플 1:

  • 표본 크기 n 1 = 40
  • 표본 분산 s 1 2 = 18.5

샘플 2:

  • 표본 크기 n 2 = 38
  • 표본 분산 s 2 2 = 6.7

두 샘플 간의 통합 분산을 계산하는 방법은 다음과 같습니다.

  • s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
  • s p 2 = ( (40-1)*18.5 + (38-1)*6.7 ) / (40+38-2)
  • s p 2 = (39*18.5 + 37*6.7) / (76) = 12.755

합동 분산은 12,755 입니다.

합동 분산 값은 18.5와 6.7의 두 원래 분산 사이에 있습니다. 풀링된 분산이 두 표본 분산의 가중 평균이라는 점을 고려하면 이는 의미가 있습니다.

보너스 리소스:합동 분산 계산기를 사용하면 두 샘플 간의 합동 분산을 자동으로 계산할 수 있습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다