R で点双系列相関を計算する方法
点双直列相関は、バイナリ変数 x と連続変数 y の間の関係を測定するために使用されます。
ピアソン相関係数と同様に、点双直列相関係数は -1 から 1 までの値をとります。
- -1 は、2 つの変数間の完全な負の相関を示します。
- 0 は 2 つの変数間に相関がないことを示します
- 1 は、2 つの変数間の完全な正の相関関係を示します。
このチュートリアルでは、R の 2 つの変数間の点双系列相関を計算する方法を説明します。
例: R での点と双列の相関
二値変数 x と連続変数 y があるとします。
x <- c(0, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0) y <- c(12, 14, 17, 17, 11, 22, 23, 11, 19, 8, 12)
組み込みの R 関数cor.test()を使用して、2 つの変数間の点と双系列の相関を計算できます。
#calculate point-biserial correlation
cor.test(x, y)
Pearson's product-moment correlation
data: x and y
t = 0.67064, df = 9, p-value = 0.5193
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.4391885 0.7233704
sample estimates:
horn
0.2181635
結果から次のことがわかります。
- 点双直列相関係数は0.218です。
- 対応する p 値は0.5193です。
相関係数が正であることから、変数xが値「1」をとるときの方が、変数xが値「0」をとるときよりも変数yが高い値をとる傾向があることを示している。
ただし、この相関関係の p 値は 0.05 未満ではないため、この相関関係は統計的に有意ではありません。
この結果は、真の相関係数の 95% 信頼区間も提供し、次のようになります。
95% CI = (-0.439, 0.723)
この信頼区間にはゼロが含まれているため、相関係数が統計的に有意ではないというさらなる証拠が得られます。
注: cor.test()関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、R で他の相関係数を計算する方法を説明します。
R で偏相関を計算する方法
R でスライド相関を計算する方法
R でスピアマンの順位相関を計算する方法
R でポリコリック相関を計算する方法