如何计算 r 中的点双列相关性
点双列相关用于测量二元变量 x 和连续变量 y 之间的关系。
与Pearson 相关系数类似,点双列相关系数取 -1 到 1 之间的值,其中:
- -1表示两个变量之间完全负相关
- 0 表示两个变量之间没有相关性
- 1 表示两个变量之间完全正相关
本教程介绍如何计算 R 中两个变量之间的点二列相关性。
示例:R 中的点双列相关
假设我们有一个二元变量 x 和一个连续变量 y:
x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0) y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)
我们可以使用内置的 R 函数cor.test()来计算两个变量之间的点二列相关性:
#calculate point-biserial correlation
cor.test(x, y)
Pearson's product-moment correlation
data: x and y
t = 0.67064, df = 9, p-value = 0.5193
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.4391885 0.7233704
sample estimates:
horn
0.2181635
从结果中我们可以观察到以下几点:
- 点双列相关系数为0.218
- 相应的 p 值为0.5193
由于相关系数为正,这表明当变量x取值“1”时,变量y往往比变量x取值“0”时取更高的值。
然而,由于该相关性的 p 值不小于 0.05,因此该相关性在统计上不显着。
请注意,结果还提供了真实相关系数的 95% 置信区间,结果为:
95% CI = (-0.439, 0.723)
由于该置信区间包含零,这进一步证明相关系数在统计上不显着。
注意:您可以在此处找到cor.test()函数的完整文档。
其他资源
以下教程解释了如何在 R 中计算其他相关系数:
如何在 R 中计算偏相关
如何计算R中的滑动相关性
如何在 R 中计算 Spearman 等级相关
如何在 R 中计算多相关性