Python에서 2-표본 t 테스트를 수행하는 방법

에 의해 벤자민 앤더슨 7월 28, 2023 가이드 댓글 0개

2-표본 t-검정은 두 모집단의 평균이 같은지 여부를 검정하는 데 사용됩니다.

이 튜토리얼에서는 Python에서 2-표본 t-검정을 수행하는 방법을 설명합니다.

예: Python의 두 가지 t-test 예

연구자들은 서로 다른 두 식물 종의 평균 키가 동일한지 알고 싶어합니다. 이를 테스트하기 위해 그들은 각 종의 식물 20개로 구성된 단순 무작위 표본을 수집합니다.

두 식물 종이 같은 높이인지 확인하기 위해 2-표본 t-검정을 수행하려면 다음 단계를 따르십시오.

1단계: 데이터를 생성합니다.

먼저, 20개 식물의 각 그룹에 대한 측정값을 보관할 두 개의 테이블을 만듭니다.

 import numpy as np

group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12])
group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])

2단계: 2-표본 t-검정을 수행합니다.

다음으로 scipy.stats 라이브러리의 ttest_ind() 함수를 사용하여 다음 구문을 사용하는 두 가지 예 t-테스트를 수행합니다.

ttest_ind(a, b, equal_var=True)

금:

a: 그룹 1에 대한 관찰 사례 표
b: 그룹 2에 대한 관찰 예 표
equal_var: true인 경우 모집단 분산이 동일하다고 가정하는 표준 독립 2-표본 t-검정을 수행합니다. false인 경우 모집단 분산이 동일하다고 가정하지 않는 Welch의 t-검정을 수행합니다. 이는 기본적으로 사실입니다.

테스트를 수행하기 전에 두 모집단의 분산이 동일하다고 가정할지 여부를 결정해야 합니다. 일반적으로 가장 큰 표본 분산과 가장 작은 표본 분산의 비율이 4:1보다 작으면 모집단의 분산이 동일하다고 가정할 수 있습니다.

 #find variance for each group
print(np.var(group1), np.var(group2))

7.73 12.26

가장 큰 표본 분산과 가장 작은 표본 분산의 비율은 12.26/7.73 = 1.586 이며 이는 4보다 작습니다. 이는 모집단의 분산이 동일하다고 가정할 수 있음을 의미합니다.

따라서 등분산을 사용하여 2-표본 t 검정을 수행할 수 있습니다.

 import scipy.stats as stats

#perform two sample t-test with equal variances
stats.ttest_ind(a=group1, b=group2, equal_var=True)

(statistic=-0.6337, pvalue=0.53005)

t-검정 통계량은 -0.6337 이고 해당 양측 p-값은 0.53005 입니다.

3단계: 결과를 해석합니다.

이 특정 2-표본 t-검정에 대한 두 가지 가정은 다음과 같습니다.

H ₀ : µ ₁ = µ ₂ (두 모집단 평균이 동일함)

H _A : µ ₁ ≠ µ ₂ (두 모집단 평균이 동일 하지 않음 )

테스트의 p-값 (0.53005) 이 알파 = 0.05보다 크기 때문에 테스트의 귀무 가설을 기각하지 못합니다. 두 개체군 사이의 평균 식물 높이가 다르다고 말할 수 있는 충분한 증거가 없습니다.

추가 리소스

Python에서 단일 표본 T-검정을 수행하는 방법
Python에서 쌍체 표본 T-검정을 수행하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: Python의 두 가지 t-test 예

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다