Python에서 2-표본 t 테스트를 수행하는 방법
2-표본 t-검정은 두 모집단의 평균이 같은지 여부를 검정하는 데 사용됩니다.
이 튜토리얼에서는 Python에서 2-표본 t-검정을 수행하는 방법을 설명합니다.
예: Python의 두 가지 t-test 예
연구자들은 서로 다른 두 식물 종의 평균 키가 동일한지 알고 싶어합니다. 이를 테스트하기 위해 그들은 각 종의 식물 20개로 구성된 단순 무작위 표본을 수집합니다.
두 식물 종이 같은 높이인지 확인하기 위해 2-표본 t-검정을 수행하려면 다음 단계를 따르십시오.
1단계: 데이터를 생성합니다.
먼저, 20개 식물의 각 그룹에 대한 측정값을 보관할 두 개의 테이블을 만듭니다.
import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])
2단계: 2-표본 t-검정을 수행합니다.
다음으로 scipy.stats 라이브러리의 ttest_ind() 함수를 사용하여 다음 구문을 사용하는 두 가지 예 t-테스트를 수행합니다.
ttest_ind(a, b, equal_var=True)
금:
- a: 그룹 1에 대한 관찰 사례 표
- b: 그룹 2에 대한 관찰 예 표
- equal_var: true인 경우 모집단 분산이 동일하다고 가정하는 표준 독립 2-표본 t-검정을 수행합니다. false인 경우 모집단 분산이 동일하다고 가정하지 않는 Welch의 t-검정을 수행합니다. 이는 기본적으로 사실입니다.
테스트를 수행하기 전에 두 모집단의 분산이 동일하다고 가정할지 여부를 결정해야 합니다. 일반적으로 가장 큰 표본 분산과 가장 작은 표본 분산의 비율이 4:1보다 작으면 모집단의 분산이 동일하다고 가정할 수 있습니다.
#find variance for each group
print(np.var(group1), np.var(group2))
7.73 12.26
가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 12.26/7.73 = 1.586 이며 이는 4보다 작습니다. 이는 모집단의 분산이 동일하다고 가정할 수 있음을 의미합니다.
따라서 등분산을 사용하여 2-표본 t 검정을 수행할 수 있습니다.
import scipy.stats as stats #perform two sample t-test with equal variances stats.ttest_ind(a=group1, b=group2, equal_var=True) (statistic=-0.6337, pvalue=0.53005)
t-검정 통계량은 -0.6337 이고 해당 양측 p-값은 0.53005 입니다.
3단계: 결과를 해석합니다.
이 특정 2-표본 t-검정에 대한 두 가지 가정은 다음과 같습니다.
H 0 : µ 1 = µ 2 (두 모집단 평균이 동일함)
H A : µ 1 ≠ µ 2 (두 모집단 평균이 동일 하지 않음 )
테스트의 p-값 (0.53005) 이 알파 = 0.05보다 크기 때문에 테스트의 귀무 가설을 기각하지 못합니다. 두 개체군 사이의 평균 식물 높이가 다르다고 말할 수 있는 충분한 증거가 없습니다.