如何在 r 中执行两个样本 t 检验
双样本 t 检验用于检验两个总体的均值是否相等。
您可以使用以下基本语法在 R 中执行两个示例 t 检验:
t. test (group1, group2, var. equal = TRUE )
注意:通过指定var.equal=TRUE ,我们告诉 R 假设两个样本之间的方差相等。
如果您不想做出此假设,只需将此参数放在一边,R 将改为执行Welch t 检验,该检验不假设样本之间的方差相等。
以下示例展示了如何在实践中在 R 中执行两个样本 t 检验。
示例:R 中的双样本 T 检验
假设我们想知道两种不同种类的植物是否具有相同的平均高度。
为了测试这一点,我们从每个物种中收集了 12 种植物的简单随机样本。
以下代码显示如何在 R 中执行两个样本 t 检验以确定两个物种之间的平均高度是否相等:
#create vectors to hold plant heights from each sample group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19) #perform two sample t-tests t. test (group1, group2, var. equal = TRUE ) Two Sample t-test data: group1 and group2 t = -2.5505, df = 22, p-value = 0.01823 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.5904820 -0.5761847 sample estimates: mean of x mean of y 11.66667 14.75000
以下是如何解释测试结果:
data:包含样本数据的向量的名称。
t: t 检验统计量。在本例中为-2.5505 。
df :自由度,计算公式为 n 1 + n 2 – 2 = 12 + 12 – 2 = 22 。
p 值:对应于 -2.5505 和 df = 22 的检验统计量的 p 值。p 值结果为.01823 。我们可以使用T 分数到 P 值计算器来确认该值。
95% 置信区间:两组之间平均值真实差异的 95% 置信区间。结果是[-5.59, -.576] 。
样本估计:每组的样本平均值。在本例中,第 1 组的样本平均值为11.667 ,第 2 组的样本平均值为14.75 。
此特定双样本 t 检验的原假设和备择假设如下:
H 0 : µ 1 = µ 2 (两个总体平均值相等)
H A : µ 1 ≠ µ 2 (两个总体平均值不相等)
我们的检验的 p 值(0.01823)小于 0.05,我们拒绝原假设。
这意味着我们有足够的证据得出结论,两个物种之间的平均株高不相等。
技术说明
R 中的t.test()函数使用以下语法:
t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)
金子:
- x、y:包含数据的两个向量的名称。
- 替代:替代假设。选项包括“双面”、“更少”或“更大”。
- mu:假定为平均值的真实差异的值。
- 配对:是否使用配对 t 检验。
- var.equal:两组之间的差异是否相等。
- conf.level:用于测试的置信度。
在执行您自己的 t 检验时,请随意修改这些参数中的任何一个,具体取决于您希望执行的特定测试。
其他资源
以下教程解释了如何在 R 中执行其他常见任务: