如何在 r 中执行两个样本 t 检验


双样本 t 检验用于检验两个总体的均值是否相等。

您可以使用以下基本语法在 R 中执行两个示例 t 检验:

 t. test (group1, group2, var. equal = TRUE ) 

注意:通过指定var.equal=TRUE ,我们告诉 R 假设两个样本之间的方差相等。

如果您不想做出此假设,只需将此参数放在一边,R 将改为执行Welch t 检验,该检验不假设样本之间的方差相等。

以下示例展示了如何在实践中在 R 中执行两个样本 t 检验。

示例:R 中的双样本 T 检验

假设我们想知道两种不同种类的植物是否具有相同的平均高度。

为了测试这一点,我们从每个物种中收集了 12 种植物的简单随机样本

以下代码显示如何在 R 中执行两个样本 t 检验以确定两个物种之间的平均高度是否相等:

 #create vectors to hold plant heights from each sample
group1 <- c(8, 8, 9, 9, 9, 11, 12, 13, 13, 14, 15, 19)
group2 <- c(11, 12, 13, 13, 14, 14, 14, 15, 16, 18, 18, 19)

#perform two sample t-tests
t. test (group1, group2, var. equal = TRUE )

	Two Sample t-test

data: group1 and group2
t = -2.5505, df = 22, p-value = 0.01823
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -5.5904820 -0.5761847
sample estimates:
mean of x mean of y 
 11.66667 14.75000 

以下是如何解释测试结果:

data:包含样本数据的向量的名称。

t: t 检验统计量。在本例中为-2.5505

df :自由度,计算公式为 n 1 + n 2 – 2 = 12 + 12 – 2 = 22

p 值:对应于 -2.5505 和 df = 22 的检验统计量的 p 值。p 值结果为.01823 。我们可以使用T 分数到 P 值计算器来确认该值。

95% 置信区间:两组之间平均值真实差异的 95% 置信区间。结果是[-5.59, -.576]

样本估计:每组的样本平均值。在本例中,第 1 组的样本平均值为11.667 ,第 2 组的样本平均值为14.75

此特定双样本 t 检验的原假设和备择假设如下:

H 0 : µ 1 = µ 2 (两个总体平均值相等)

H A : µ 1 ≠ µ 2 (两个总体平均值相等)

我们的检验的 p 值(0.01823)小于 0.05,我们拒绝原假设。

这意味着我们有足够的证据得出结论,两个物种之间的平均株高不相等。

技术说明

R 中的t.test()函数使用以下语法:

 t. test (x, y, alternative="two.sided", mu=0, paired=FALSE, var.equal=FALSE, conf.level=0.95)

金子:

  • x、y:包含数据的两个向量的名称。
  • 替代:替代假设。选项包括“双面”、“更少”或“更大”。
  • mu:假定为平均值的真实差异的值。
  • 配对:是否使用配对 t 检验。
  • var.equal:两组之间的差异是否相等。
  • conf.level:用于测试的置信度。

在执行您自己的 t 检验时,请随意修改这些参数中的任何一个,具体取决于您希望执行的特定测试。

其他资源

以下教程解释了如何在 R 中执行其他常见任务:

如何在 R 中执行单样本 T 检验
如何在 R 中执行 Welch 的 T 检验
如何在 R 中执行配对样本 t 检验

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注