Rの相関係数のp値を求める方法
ピアソンの相関係数を使用して、2 つの変数間の線形関連を測定できます。
この相関係数は常に-1から1までの値を取ります。
- -1 : 2 つの変数間の完全な負の線形相関。
- 0 : 2 つの変数間に線形相関はありません。
- 1: 2 つの変数間の完全な正の線形相関。
相関係数が統計的に有意かどうかを判断するには、対応する t スコアと p 値を計算します。
相関係数 (r) の t スコアを計算する式は次のとおりです。
t = r√ n-2 / √ 1-r 2
p 値は、自由度 n-2 の t 分布の対応する両側 p 値として計算されます。
R のピアソン相関係数の p 値を計算するには、 cor.test()関数を使用できます。
horn. test (x,y)
次の例は、この関数を実際に使用する方法を示しています。
例: R の相関係数の P 値を計算する
次のコードは、 cor.test()関数を使用して、R の 2 つの変数間の相関係数の p 値を計算する方法を示しています。
#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate correlation coefficient and corresponding p-value
horn. test (x,y)
Pearson's product-moment correlation
data: x and y
t = -1.7885, df = 8, p-value = 0.1115
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.8709830 0.1434593
sample estimates:
horn
-0.5344408
結果から次のことがわかります。
- ピアソン相関係数は-0.5344408です。
- 対応する p 値は0.1115です。
相関係数が負であるため、2 つの変数間に負の線形関係があることを示します。
ただし、相関係数の p 値は 0.05 以上であるため、相関は統計的に有意ではありません。
cor.test(x, y)$p.value と入力して、相関係数の p 値のみを抽出することもできることに注意してください。
#create two variables
x <- c(70, 78, 90, 87, 84, 86, 91, 74, 83, 85)
y <- c(90, 94, 79, 86, 84, 83, 88, 92, 76, 75)
#calculate p-value for correlation between x and y
horn. test (x, y)$p.value
[1] 0.1114995
相関係数の p 値は0.1114995です。
これは、前の出力の p 値と一致します。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。