T-검정에서 등분산 또는 불등분산을 결정하는 방법
두 개의 독립적인 그룹의 평균을 비교하려는 경우 두 가지 다른 테스트 중에서 선택할 수 있습니다.
스튜던트 t-검정: 두 데이터 그룹이 모두 정규 분포를 따르는 모집단에서 샘플링되고 두 모집단의 분산이 동일하다고 가정합니다.
Welch의 t-검정: 두 데이터 그룹이 정규 분포를 따르는 모집단에서 샘플링되었다고 가정하지만 이 두 모집단의 분산이 동일하다고 가정하지는 않습니다 .
따라서 두 표본의 분산이 동일하지 않은 경우 Welch의 t-검정을 사용하는 것이 좋습니다.
하지만 두 표본의 분산이 동일한지 어떻게 확인할 수 있습니까?
이를 수행하는 방법에는 두 가지가 있습니다.
1. 경험에 의한 분산 법칙을 사용하십시오.
일반적으로 가장 큰 분산과 가장 작은 분산의 비율이 4보다 작으면 분산이 대략 같다고 가정하고 스튜던트 t-검정을 사용할 수 있습니다.
예를 들어 다음과 같은 두 가지 예가 있다고 가정해 보겠습니다.
표본 1의 분산은 24.86이고 표본 2의 분산은 15.76입니다.
가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 다음과 같이 계산됩니다.
비율 = 24.86 / 15.76 = 1.577
이 비율이 4보다 작으므로 두 그룹 간의 차이가 거의 동일하다고 가정할 수 있습니다.
따라서 두 그룹의 평균이 동일한지 여부를 확인하기 위해 스튜던트 t 테스트를 수행할 수 있습니다.
2. F-검정을 수행합니다.
F-검정은 다음과 같은 귀무 가설과 대립 가설을 사용하는 공식적인 통계 검정입니다.
H 0 : 표본의 분산이 동일합니다.
H A : 표본의 분산이 동일하지 않습니다.
검정 통계량은 다음과 같이 계산됩니다.
F = 초 1 2 / 초 2 2
여기서 s 1 2 및 s 2 2 는 표본 분산입니다.
검정 통계량에 해당하는 p-값이 특정 유의 수준(예: 0.05)보다 낮으면 표본에 등분산이 없다고 말할 수 있는 충분한 증거가 있는 것입니다.
다음 두 가지 예가 있다고 다시 가정해 보겠습니다.
이 두 표본에 대해 F-검정을 수행하기 위해 다음과 같이 F-검정 통계량을 계산할 수 있습니다.
- F = 초 1 2 / 초 2 2
- F = 24.86 / 15.76
- F = 1.577
F 분포 계산기 에 따르면 분자 df = n 1 -1 = 12이고 분모 df = n 2 -1 = 12인 F 값 1.577의 해당 p 값은 0.22079입니다.
이 p-값은 0.05 이상이므로 귀무가설을 기각할 수 없습니다. 즉, 표본 분산이 동일하다고 가정할 수 있습니다.
따라서 두 그룹의 평균이 동일한지 여부를 확인하기 위해 스튜던트 t 테스트를 수행할 수 있습니다.
추가 리소스
스튜던트 t-테스트를 수행하기로 결정한 경우 다음 자습서를 참조로 사용할 수 있습니다.
Welch의 t-검정을 수행하기로 결정한 경우 다음 자습서를 참조로 사용할 수 있습니다.