Welch의 t 검정: 사용 시기 + 예


두 개의 독립적인 그룹의 평균을 비교하려는 경우 두 가지 다른 테스트 사용 중에서 선택할 수 있습니다.

스튜던트 t-검정: 이 검정은 두 데이터 그룹이 정규 분포를 따르는 모집단에서 샘플링되고 두 모집단의 분산이 동일하다고 가정합니다.

Welch의 t-검정: 이 검정에서는 두 데이터 그룹이 모두 정규 분포를 따르는 모집단에서 샘플링되었다고 가정 하지만 이 두 모집단의 분산이 동일하다고 가정하지는 않습니다 .

Student’s t-test와 Welch’s t-test의 차이점

스튜던트 t-테스트와 Welch의 t-테스트 수행 방법에는 두 가지 차이점이 있습니다.

  • 테스트 통계
  • 자유도

학생의 t-테스트:

검정 통계량: ( x 1x 2 ) / s p (√ 1/n 1 + 1/n 2 )

여기서 x 1x 2 는 표본 평균이고, n 1 과 n 2 는 각각 표본 1과 표본 2에 대한 표본 크기이며, s p 는 다음과 같이 계산됩니다.

s p = (n 1 -1)s 1 2 + (n 2 -1)s 2 2 / (n 1 +n 2 -2)

여기서 s 1 2 및 s 2 2 는 표본 분산입니다.

자유도: n 1 + n 2 – 2

웰치의 T-검정

검정 통계량: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

자유도: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

Welch의 t-검정의 자유도를 계산하는 공식은 두 표준 편차 간의 차이를 고려합니다. 두 표본의 표준 편차가 동일한 경우 Welch의 t-검정의 자유도는 Student의 t-검정의 자유도와 정확히 동일합니다.

일반적으로 두 표본의 표준 편차는 동일하지 않으므로 Welch의 t-검정의 자유도는 Student의 t-검정의 자유도보다 작은 경향이 있습니다.

Welch의 t-검정의 자유도는 일반적으로 정수가 아니라는 점에 유의하는 것도 중요합니다. 수동으로 테스트하는 경우 가장 낮은 정수로 반올림하는 것이 가장 좋습니다. R 과 같은 통계 소프트웨어를 사용하면 소프트웨어에서 자유도의 십진수 값을 제공할 수 있습니다.

Welch t-검정은 언제 사용해야 합니까?

어떤 사람들은 Welch의 t-검정이 두 독립 그룹의 평균을 비교하기 위한 기본 선택이어야 한다고 주장합니다. 왜냐하면 Welch의 t-검정은 그룹 간에 표본 크기와 분산이 동일하지 않을 때 스튜던트 t-검정보다 더 나은 성능을 발휘하고 표본 크기가 동일할 때 동일한 결과를 제공하기 때문입니다. 다르다. 차이점은 동일합니다.

실제로 두 그룹의 평균을 비교할 때 각 그룹의 표준 편차가 동일할 가능성은 거의 없습니다. 따라서 항상 Welch의 t-검정을 사용하는 것이 좋습니다. 그러면 등분산에 대한 가정을 할 필요가 없습니다.

Welch의 t-검정 사용 예

다음으로 다음 두 표본에 대해 Welch의 t-검정을 수행하여 모집단 평균이 0.05 유의 수준에서 크게 다른지 여부를 확인합니다.

샘플 1: 14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25

샘플 2: 10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34

세 가지 방법으로 테스트를 수행하는 방법을 설명하겠습니다.

  • 손으로
  • 마이크로소프트 엑셀을 사용하세요
  • R 통계 프로그래밍 언어 사용

Welch의 T 테스트를 직접 수행

Welch t-검정을 직접 수행하려면 먼저 표본 평균, 표본 분산 및 표본 크기를 찾아야 합니다.

x1 19.27
x2 23.69
1시 2 – 오후 8시 42분
예술 2 2 – 83.23
# 1 – 11
#
2 – 13

그런 다음 다음 숫자를 입력하여 테스트 통계를 찾을 수 있습니다.

검정 통계량: ( x 1x 2 ) / (√ s 1 2 /n 1 + s 2 2 /n 2 )

검정 통계량: (19.27 – 23.69) / (√ 20.42/11 + 83.23/13 ) = -4.42 / 2.873 = -1.538

자유도: (s 1 2 /n 1 + s 2 2 /n 2 ) 2 / { [ (s 1 2 / n 1 ) 2 / (n 1 – 1) ] + [ (s 2 2 / n 2 ) 2 / (n 2 – 1) ] }

자유도: (20.42/11 + 83.23/13) 2 / { [ (20.42/11) 2 / (11 – 1) ] + [ (83.23/13) 2 / (13 – 1) ] } = 18.137. 이 결과를 가장 가까운 정수인 18 로 반올림합니다.

마지막으로 18 자유도에 대해 알파 = 0.05인 양면 테스트에 해당하는 t 분포 테이블에서 임계값 t를 찾습니다.

배포 테이블 T

임계값 t는 2.101 입니다. 검정 통계량(1.538)의 절대값이 임계값 t보다 크지 않기 때문에 검정의 귀무가설을 기각할 수 없습니다. 두 모집단의 평균이 크게 다르다고 말할 수 있는 증거가 충분하지 않습니다.

Excel을 사용한 Welch의 T-검정

Excel에서 Welch의 t-검정을 수행하려면 먼저 무료 Analysis ToolPak 소프트웨어를 다운로드해야 합니다. 아직 Excel로 다운로드하지 않으셨다면 다운로드 방법에 대한 간단한 튜토리얼을 작성해 두었습니다.

Analysis ToolPak을 다운로드한 후에는 아래 단계에 따라 두 샘플에 대해 Welch의 t-테스트를 수행할 수 있습니다.

1. 데이터를 입력합니다. A열과 B열에 두 샘플에 대한 데이터 값을 입력하고 각 열의 첫 번째 셀에 Sample 1Sample 2 라는 제목을 입력합니다.

2. Analysis ToolPak을 사용하여 Welch의 t-검정을 수행합니다. 상단 리본에 있는 데이터 탭으로 이동합니다. 그런 다음 분석 그룹에서 분석 도구 아이콘을 클릭합니다.

표시되는 대화 상자에서 t-검정: 두 표본이 동일하지 않은 분산을 가정 하고 확인을 클릭합니다.

마지막으로 아래 값을 입력한 후 확인을 클릭하세요.

다음 결과가 나타나야 합니다.

이 테스트의 결과는 수동으로 얻은 결과와 일치합니다.

  • 검정 통계량은 -1.5379 입니다.
  • 양측 임계값은 2.1009 입니다.
  • 검정 통계량의 절대값이 양측 임계값보다 크지 않으므로 두 모집단의 평균은 통계적으로 다르지 않습니다.
  • 또한 검정의 양측 p-값은 0.14로 0.05보다 크고 두 모집단의 평균이 통계적으로 다르지 않음을 확인합니다.

R을 사용한 Welch의 t-검정

다음 코드는 R 통계 프로그래밍 언어를 사용하여 두 샘플에 대해 Welch의 t-테스트를 수행하는 방법을 보여줍니다.

 #create two vectors to hold sample data values
sample1 <- c(14, 15, 15, 15, 16, 18, 22, 23, 24, 25, 25)
sample2 <- c(10, 12, 14, 15, 18, 22, 24, 27, 31, 33, 34, 34, 34)

#conduct Welch's test
t.test( sample1, sample2)

# Welch Two Sample t-test
#
#data: sample1 and sample2
#t = -1.5379, df = 18.137, p-value = 0.1413
#alternative hypothesis: true difference in means is not equal to 0
#95 percent confidence interval:
#-10.453875 1.614714
#sample estimates:
#mean of x mean of y 
#19.27273 23.69231 
#

t.test() 함수는 다음과 같은 관련 출력을 표시합니다.

  • t: 검정 통계량 = -1.5379
  • df : 자유도 = 18.137
  • p-값: 양측 검정의 p-값 = 0.1413
  • 95% 신뢰구간 : 모집단 평균의 실제 차이에 대한 95% 신뢰구간 = (-10.45, 1.61)

이 테스트의 결과는 Excel을 사용하여 수동으로 얻은 결과와 일치합니다. 이 두 모집단의 평균 차이는 알파 = 0.05 수준에서 통계적으로 유의하지 않습니다.

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다