完整指南:如何解释 r 中的 t 检验结果
双样本 t 检验用于检验两个总体的均值是否相等。
本教程提供了有关如何解释 R 中双样本 t 检验结果的完整指南。
第 1 步:创建数据
假设我们想知道两种不同种类的植物是否具有相同的平均高度。为了测试这一点,我们从每个物种中收集了 12 种植物的简单随机样本。
#create vector of plant heights from group 1 group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19) #create vector of plant heights from group 2 group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)
步骤 2:执行并解释双样本 t 检验
接下来,我们将使用t.test()命令执行两个示例 t 检验:
#perform two sample t-tests t. test (group1, group2) Welch Two Sample t-test data: group1 and group2 t = -2.5505, df = 20.488, p-value = 0.01884 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -5.6012568 -0.5654098 sample estimates: mean of x mean of y 11.66667 14.75000
以下是如何解释测试结果:
数据:这告诉我们在两个样本 t 检验中使用的数据。在本例中,我们使用称为 group1 和 group2 的向量。
t:这是 t 检验统计量。在本例中为-2.5505 。
df :这些是与 t 检验统计量相关的自由度。在本例中,它是20,488 。有关如何计算此自由度值的说明,请参阅Satterthwaire 近似。
p 值:这是对应于检验统计量 -2.5505 和 df = 20.488 的 p 值。 p 值为.01884 。我们可以使用T 分数到 P 值计算器来确认该值。
备择假设:这告诉我们用于此特定 t 检验的备择假设。在这种情况下,备择假设是两组之间均值的真实差异不等于零。
95% 置信区间:这告诉我们两组之间平均值的真实差异的 95% 置信区间。结果是[-5.601, -.5654] 。
样本估计:这告诉我们每组的样本平均值。在本例中,第 1 组的样本平均值为11.667 ,第 2 组的样本平均值为14.75 。
此特定双样本 t 检验的两个假设是:
H 0 : µ 1 = µ 2 (两个总体平均值相等)
H A : µ 1 ≠ µ 2 (两个总体平均值不相等)
由于我们的检验的 p 值(0.01884)小于 alpha = 0.05,因此我们拒绝检验的原假设。这意味着我们有足够的证据表明两个种群之间的平均株高是不同的。
评论
R 中的t.test()函数使用以下语法:
t.test(x,y,alternative =“两侧”,mu = 0,paired = FALSE,var.equal = FALSE,conf.level = 0.95)
金子:
- x、y:包含数据的两个向量的名称。
- 替代:替代假设。选项包括“双面”、“更少”或“更大”。
- mu:假定为平均值的真实差异的值。
- 配对:是否使用配对 t 检验。
- var.equal:两组之间的差异是否相等。
- conf.level:用于测试的置信度。
在上面的示例中,我们使用了以下假设:
在执行您自己的 t 检验时,请随意修改这些参数中的任何一个,具体取决于您希望执行的特定测试。