R で相関行列を作成する方法 (4 つの例)
相関行列は、データセット内の変数間の 相関係数を示す正方形の表です。
これは、データセット内の変数間に存在する線形関係の強さを理解する簡単な方法を提供します。
R で相関行列を作成するには、次の 4 つの一般的な方法があります。
方法 1: cor 関数 (相関係数の単純行列を取得するため)
cor(df)
方法 2: rcorr 関数 (相関係数の p 値を取得するため)
library (Hmisc)
rcorr( as.matrix (df))
方法 3: corrplot 関数 (相関行列を視覚化するため)
library (corplot)
corrplot(cor(df))
方法 4: ggcorrplot 関数 (相関行列を視覚化するため)
library (ggcorrplot)
ggcorrplot(cor(df))
次の例は、R の次のデータ フレームで各メソッドを使用する方法を示しています。
#create data frame
df <- data. frame (assists=c(4, 5, 5, 6, 7, 8, 8, 10),
rebounds=c(12, 14, 13, 7, 8, 8, 9, 13),
points=c(22, 24, 26, 26, 29, 32, 20, 14))
#view data frame
df
assists rebound points
1 4 12 22
2 5 14 24
3 5 13 26
4 6 7 26
5 7 8 29
6 8 8 32
7 8 9 20
8 10 13 14
例 1: cor 関数
R Base cor()関数を使用して、データ フレーム内の各変数間の相関係数を示す相関行列を作成できます。
#create correlation matrix
cor(df)
assists rebound points
assists 1.0000000 -0.2448608 -0.3295730
rebounds -0.2448608 1.0000000 -0.5220917
points -0.3295730 -0.5220917 1.0000000
各変数はそれ自体と完全に相関しているため、テーブルの対角線に沿った相関係数はすべて 1 に等しくなります。
他のすべての相関係数は、変数の異なるペアごとの組み合わせ間の相関を示します。例えば:
- アシストとリバウンドの相関係数は-0.245です。
- アシストと得点の相関係数は-0.330です。
- リバウンドと得点の相関係数は-0.522です。
例 2: rcorr 関数
R のHmiscパッケージのrcorr()関数を使用して、データ フレーム内の各変数間の相関係数を示す相関行列を作成できます。
library (Hmisc)
#create matrix of correlation coefficients and p-values
rcorr( as.matrix (df))
assists rebound points
assists 1.00 -0.24 -0.33
rebounds -0.24 1.00 -0.52
points -0.33 -0.52 1.00
n=8
P
assists rebound points
assists 0.5589 0.4253
rebounds 0.5589 0.1844
points 0.4253 0.1844
最初の行列は変数間の相関係数を示し、2 番目の行列は対応する p 値を示します。
たとえば、アシストとリバウンドの間の相関係数は-0.24で、この相関係数の p 値は0.5589です。
これは、2 つの変数間の相関関係が負であることを示していますが、p 値が 0.05 以上であるため、統計的に有意な相関関係ではありません。
例 3: corrplot 関数
R のcorrplotパッケージのcorrplot()関数を使用して、相関行列を視覚化できます。
library (corplot)
#visualize correlation matrix
corrplot(cor(df))
相関行列の円の色とサイズは、各変数間の相関を視覚化するのに役立ちます。
たとえば、アシスト変数とリバウンド変数が交差する円は小さくて明るい赤で、相関関係が弱く負であることがわかります。
例 4: corrplot 関数
R のggcorrplotパッケージのggcorrplot()関数を使用して、相関行列を視覚化できます。
library (ggcorrplot)
#visualize correlation matrix
ggcorrplot(cor(df))
相関行列の四角形の色は、各変数間の相関関係を視覚化するのに役立ちます。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。