Python에서 welch의 t-테스트를 수행하는 방법
두 독립 그룹 간의 평균을 비교하는 가장 일반적인 방법은 2-표본 t-검정을 사용하는 것입니다. 그러나 이 검정에서는 두 그룹 간의 분산이 동일하다고 가정합니다.
두 그룹 간의 분산이 동일 하지 않다고 생각되면 2-표본 t-검정에 해당하는 비모수적 방법인 Welch의 t-검정을 사용할 수 있습니다.
Python에서 Welch의 t-테스트를 수행하려면 다음 구문을 사용하는 SciPy 라이브러리의 ttest_ind() 함수를 사용할 수 있습니다.
ttest_ind(a, b, equal_var=False)
금:
- a: 데이터 값의 첫 번째 배열
- b: 데이터 값의 두 번째 배열
- equal_var: 두 테이블 간의 등분산 가정을 지정하지 않습니다.
이 튜토리얼에서는 이 함수를 사용하여 Python에서 Welch의 t-검정을 수행하는 방법을 설명합니다.
예: Python에서 Welch의 t-검정
시험 준비 책자를 사용하여 시험을 준비한 12명의 학생과 그렇지 않은 12명의 학생의 시험 점수를 비교한다고 가정해 보겠습니다.
다음 코드는 Python에서 Welch의 t-검정을 수행하여 두 그룹 간의 평균 시험 점수가 동일한지 확인하는 방법을 보여줍니다.
#import ttest_ind() function from scipy import stats #define two arrays of data booklet = [90, 85, 88, 89, 94, 91, 79, 83, 87, 88, 91, 90] no_booklet = [67, 90, 71, 95, 88, 83, 72, 66, 75, 86, 93, 84] #perform Welch's t-test stats. ttest_ind (booklet, no_booklet, equal_var = False ) Ttest_indResult(statistic=2.23606797749, pvalue=0.04170979503207)
검정 통계량은 2.2361 이고 해당 p-값은 0.0417 입니다.
이 p-값은 0.05보다 작으므로 검정의 귀무 가설을 기각하고 두 그룹 간의 평균 시험 점수에 통계적으로 유의한 차이가 있다는 결론을 내릴 수 있습니다.
이 예에서는 두 표본 크기가 동일했지만 Welch의 t-검정은 두 표본 크기가 동일하지 않은 경우에도 여전히 작동합니다.