전체 가이드: r에서 t-테스트 결과를 해석하는 방법
2-표본 t-검정은 두 모집단의 평균이 같은지 여부를 검정하는 데 사용됩니다.
이 튜토리얼은 R에서 2-표본 t-검정 결과를 해석하는 방법에 대한 완전한 가이드를 제공합니다.
1단계: 데이터 생성
서로 다른 두 종의 식물이 평균 키가 같은지 알고 싶다고 가정해 보겠습니다. 이를 테스트하기 위해 각 종에서 12개 식물의 단순 무작위 표본을 수집합니다.
#create vector of plant heights from group 1 group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) #create vector of plant heights from group 2 group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)
2단계: 2-표본 t-검정 수행 및 해석
다음으로 t.test() 명령을 사용하여 두 가지 예 t-테스트를 수행합니다.
#perform two sample t-tests t. test (group1, group2) Welch Two Sample t-test data: group1 and group2 t = -2.5505, df = 20.488, p-value = 0.01884 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.6012568 -0.5654098 sample estimates: mean of x mean of y 11.66667 14.75000
테스트 결과를 해석하는 방법은 다음과 같습니다.
data: 2-표본 t-검정에 사용된 데이터를 알려줍니다. 이 경우에는 group1과 group2라는 벡터를 사용했습니다.
t: t-검정 통계입니다. 이 경우에는 -2.5505 입니다.
df : t-검정 통계와 관련된 자유도입니다. 이 경우에는 20,488 입니다. 이 자유도 값이 계산되는 방법에 대한 설명은 Satterthwaire 근사치를 참조하십시오.
p-값: 검정 통계량 -2.5505 및 df = 20.488에 해당하는 p-값입니다. p-값은 .01884 로 나타났습니다. T Score to P Value 계산기를 사용하여 이 값을 확인할 수 있습니다.
대립 가설: 이는 이 특정 t-검정에 사용되는 대립 가설을 알려줍니다. 이 경우 대립 가설은 두 그룹 간의 실제 평균 차이가 0이 아니라는 것입니다.
95% 신뢰 구간: 두 그룹 간의 실제 평균 차이에 대한 95% 신뢰 구간을 알려줍니다. [-5.601, -.5654] 로 밝혀졌습니다.
표본 추정치: 각 그룹의 표본 평균을 알려줍니다. 이 경우 그룹 1의 표본 평균은 11.667 이었고 그룹 2의 표본 평균은 14.75 였습니다.
이 특정 2-표본 t-검정에 대한 두 가지 가정은 다음과 같습니다.
H 0 : µ 1 = µ 2 (두 모집단 평균이 동일함)
H A : µ 1 ≠ µ 2 (두 모집단 평균이 동일 하지 않음 )
테스트의 p-값 (0.01884) 이 알파 = 0.05보다 작으므로 테스트의 귀무 가설을 기각합니다. 이는 두 개체군 간의 평균 식물 높이가 다르다고 말할 수 있는 충분한 증거가 있음을 의미합니다.
코멘트
R의 t.test() 함수는 다음 구문을 사용합니다:
t.test(x, y, 대체 = “양측”, mu = 0, 쌍 = FALSE, var.equal = FALSE, conf.level = 0.95)
금:
- x, y: 데이터가 포함된 두 벡터의 이름입니다.
- 대안: 대안 가설. 옵션에는 “양면”, “더 작게” 또는 “더 크게”가 포함됩니다.
- mu: 평균의 실제 차이로 간주되는 값입니다.
- paired: paired t-test를 사용할지 여부.
- var.equal: 두 그룹 간의 차이가 동일한지 여부입니다.
- conf.level: 테스트에 사용할 신뢰 수준입니다.
위의 예에서는 다음과 같은 가정을 사용했습니다.
- 우리는 양측 대립 가설을 사용했습니다.
- 우리는 평균의 실제 차이가 0인지 여부를 테스트했습니다.
- 우리는 paired t test가 아닌 two-sample t test를 사용했습니다.
- 우리는 그룹 간 차이가 동일하다고 가정하지 않았습니다.
- 우리는 95%의 신뢰 수준을 사용했습니다.
수행하려는 특정 테스트에 따라 자체 t-테스트를 수행할 때 이러한 인수를 자유롭게 수정하세요.