R でペア プロットを作成および解釈する方法
ペア プロットは、データ セット内の異なる変数間のペア関係を理解できるようにする散布図行列です。
幸いなことに、 pairs()関数を使用すると、R でペア プロットを簡単に作成できます。このチュートリアルでは、この関数の実際の使用例をいくつか紹介します。
例 1: すべての変数のペア プロット
次のコードは、R のデータ フレーム内のすべての変数の塩基対プロットを作成する方法を示しています。
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
マトリックスを解釈する方法は次のとおりです。
- 変数名は斜線のボックスに沿って表示されます。
- 他のすべてのボックスには、変数のペアごとの組み合わせ間の関係の散布図が表示されます。たとえば、行列の右上隅の領域には、 var1とvar3の値の散布図が表示されます。左中央のボックスには、 var1とvar2などの値の散布図が表示されます。
この 1 つのグラフから、データセット内の変数の各ペア間の関係がわかります。たとえば、 var1とvar2 には正の相関があるように見えますが、 var1とvar3には相関がほとんどないか、まったくないように見えます。
例 2: 特定の変数のペアをプロットする
次のコードは、データ セット内の最初の 2 つの変数のみの塩基対プロットを作成する方法を示しています。
#create pairs plot for var1 and var2 only
even(df[, 1:2])
例 3: ペア プロットの外観を変更する
次のコードは、タイトル、色、ラベルなど、ペア プロットの外観を変更する方法を示しています。
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
例 4: ggpairs を使用した相関関係の取得
GGally ライブラリのggpairs()関数を使用して、変数間のピアソン相関係数を取得することもできます。次のコードは、この関数の使用方法を示しています。
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
この行列を解釈する方法は次のとおりです。
- 変数名は行列の外縁に表示されます。
- 対角線に沿ったボックスには、各変数の密度プロットが表示されます。
- 左下隅のボックスには、各変数間の散布図が表示されます。
- 右上隅のボックスには、各変数間のピアソン相関係数が表示されます。たとえば、var1 と var2 の間の相関は0.425です。
基本的な R のpairs()関数よりもggpairs()を使用する利点は、変数に関するより多くの情報を取得できることです。具体的には、変数のペアごとの組み合わせ間の相関係数と、個々の変数の密度プロットを確認できます。
ggpairs() 関数の完全なドキュメントはここで見つけることができます。