如何计算 r 中的点双列相关性


点双列相关用于测量二元变量 x 和连续变量 y 之间的关系。

Pearson 相关系数类似,点双列相关系数取 -1 到 1 之间的值,其中:

  • -1表示两个变量之间完全负相关
  • 0 表示两个变量之间没有相关性
  • 1 表示两个变量之间完全正相关

本教程介绍如何计算 R 中两个变量之间的点二列相关性。

示例:R 中的点双列相关

假设我们有一个二元变量 x 和一个连续变量 y:

 x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0)

y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)

我们可以使用内置的 R 函数cor.test()来计算两个变量之间的点二列相关性:

 #calculate point-biserial correlation
cor.test(x, y)

	Pearson's product-moment correlation

data: x and y
t = 0.67064, df = 9, p-value = 0.5193

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:
 -0.4391885 0.7233704

sample estimates:
      horn 
0.2181635 

从结果中我们可以观察到以下几点:

  • 点双列相关系数为0.218
  • 相应的 p 值为0.5193

由于相关系数为正,这表明当变量x取值“1”时,变量y往往比变量x取值“0”时取更高的值。

然而,由于该相关性的 p 值不小于 0.05,因此该相关性在统计上不显着。

请注意,结果还提供了真实相关系数的 95% 置信区间,结果为:

95% CI = (-0.439, 0.723)

由于该置信区间包含零,这进一步证明相关系数在统计上不显着。

注意:您可以在此处找到cor.test()函数的完整文档。

其他资源

以下教程解释了如何在 R 中计算其他相关系数:

如何在 R 中计算偏相关
如何计算R中的滑动相关性
如何在 R 中计算 Spearman 等级相关
如何在 R 中计算多相关性

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注