如何计算 r 中的 phi 系数


Phi 系数(有时称为均方列联系数)是两个二元变量之间关联性的度量。

对于给定两个随机变量xy的 2×2 表:

Phi系数可以计算如下:

Φ = (AD-BC) / √ (A+B)(C+D)(A+C)(B+D)

示例:计算 R 中的 Phi 系数

假设我们想知道性别是否与对政党的偏好相关。因此,我们对 25 名选民进行了简单的随机抽样,并询问他们对政党的偏好。

下表列出了调查结果:

Phi系数计算示例

我们可以使用以下代码将这些数据输入到 R 中的 2×2 矩阵中:

 #create 2x2 table
data = matrix(c(4, 8, 9, 4), nrow = 2 )

#view dataset
data

     [,1] [,2]
[1,] 4 9
[2,] 8 4

然后我们可以使用psych包中的phi()函数来计算两个变量之间的 Phi 系数:

 #load psych package
library (psych)

#calculate Phi Coefficient
phi(data)

[1] -0.36

Phi 系数结果为-0.36

请注意,phi 函数默认四舍五入为 2 位数字,但您可以指定该函数四舍五入为所需的任意位数:

 #calculate Phi Coefficient and round to 6 digits
phi(data, digits = 6 )

[1] -0.358974

如何解释 Phi 系数

与 Pearson 相关系数类似,Phi 系数取 -1 到 1 之间的值,其中:

  • -1表示两个变量之间完全负相关。
  • 0表示两个变量之间没有关联。
  • 1表明两个变量之间存在完全正相关关系。

一般来说,Phi 系数离零越远,两个变量之间的关系越强。

换句话说,Phi 系数离零越远,两个变量之间存在某种系统模式的证据就越多。

其他资源

Phi系数简介
Phi系数计算器

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注