Satterthwaite 근사: 정의 및 예


Satterthwaite 근사는 2-표본 t-검정에서 “유효 자유도”를 찾는 데 사용되는 공식입니다.

이는 표본이 추출된 모집단의 분산이 동일하다는 가정 없이 두 독립 표본의 평균을 비교하는 Welch의 t-검정 에서 가장 자주 사용됩니다.

Satterthwaite 근사 공식은 다음과 같습니다.

 Degrees of freedom: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 /(n 2 – 1)]}

금:

  • s 1 2 , s 2 2 : 각각 첫 번째와 두 번째 표본의 표본 분산입니다.
  • n1 , n2 : 각각 첫 번째 샘플과 두 번째 샘플의 샘플 크기입니다.

다음 예에서는 Satterthwaite 근사를 사용하여 유효 자유도를 계산하는 방법을 보여줍니다.

예: Satterthwaite 근사 계산

서로 다른 두 식물종의 평균 키가 같은지 알고 싶다고 가정해 보겠습니다. 따라서 우리는 각 종에 대해 두 개의 단순 무작위 표본을 수집하고 각 표본에서 식물의 키를 측정할 것입니다.

다음 값은 각 샘플의 높이(인치)를 나타냅니다.

샘플 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

샘플 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

평균, 분산 및 표본 크기는 다음과 같습니다.

  • x1 = 19.27
  • x2 = 23.69
  • 1 2 = 20.42
  • 2 2 = 83.23
  • n1 = 11
  • n2 = 13

그런 다음 분산 값과 표본 크기를 Satterthwaite 근사 공식에 연결하여 유효 자유도를 찾을 수 있습니다.

 df = (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / {[(s 1 2 /n 1 ) 2 /(n 1 – 1)] + [(s 2 2 /n 2 ) 2 / (n 2 – 1)]} 

df = (20.42/11 + 83.23/13) 2 /{[(20.42/11) 2 /(11 – 1)] + [(83.23/13) 2 /(13 – 1)]} = 18.137

유효 자유도는 18,137 입니다.

일반적으로 이 값을 가장 가까운 정수로 반올림하므로 Welch의 t-검정에서 사용할 자유도는 18 입니다.

마지막으로 18 자유도에 대해 알파 = 0.05인 양측 테스트에 해당하는 t 분포 테이블에서 임계값 t를 찾습니다.

배포 테이블 T

임계값 t는 2.101 입니다.

그런 다음 테스트 통계를 다음과 같이 계산합니다.

검정 통계량: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

검정 통계량: (19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538

검정 통계량(1.538)의 절대값이 임계값 t보다 크지 않기 때문에 검정의 귀무가설을 기각할 수 없습니다.

두 모집단의 평균이 크게 다르다고 말할 수 있는 증거가 충분하지 않습니다.

실제로 Satterthwaite 근사

실제로 Satterthwaite 근사치를 수동으로 계산할 필요는 거의 없습니다.

대신 R, Python, Excel, SAS 및 Stata와 같은 일반적인 통계 소프트웨어는 모두 Satterthwaite 근사치를 사용하여 유효 자유도를 자동으로 계산할 수 있습니다.

추가 리소스

가설 검정 소개
2-표본 t 검정 소개
Welch t-검정 소개

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다