R で散布図行列を作成する方法 (2 つの例)
散布図行列は、データセット内の異なる変数間のペア関係を理解できるようにする散布図行列です。
R で散布図行列を作成するには、次の 2 つの一般的な方法があります。
方法 1: Base R を使用する
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
方法 2: ggplot2 および GGally パッケージを使用する
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
次の例は、R の次のデータ フレームで各メソッドを実際に使用する方法を示しています。
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
例 1: 基数 R を使用して散布図行列を作成する
基本の R Lot()関数を使用して、データ フレーム内の各変数の散布図行列を作成できます。
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
マトリックスを解釈する方法は次のとおりです。
- 変数名は斜線のボックスに沿って表示されます。
- 他のすべてのボックスには、変数のペアごとの組み合わせ間の関係の散布図が表示されます。たとえば、マトリックスの右上隅にあるボックスには、ポイントとリバウンドの値の散布図が表示されます。左中央の領域には、ポイントやアシストなどの値の散布図が表示されます。
cex はパス内のポイントのサイズを制御し、 col はポイントの色を制御することに注意してください。
例 2: ggplot2 と GGally を使用して散布図行列を作成する
R の ggplot2 および GGally パッケージのggpairs()関数を使用して、データ フレーム内の各変数の散布図行列を作成することもできます。
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
この散布図行列には、R ベースのLot()関数と同じ散布図が含まれていますが、さらに、変数のペアごとの組み合わせ間の相関係数や、個々の変数の密度プロットも確認できます。
たとえば、次のことがわかります。
- アシストと得点の相関係数は0.571です。
- リバウンドと得点の相関係数は-0.598です。
- リバウンドとアシストの間の相関係数は-0.740です。
-0.740 の隣にある小さな星 ( * ) は、リバウンドとアシストの間の相関関係が統計的に有意であることも示しています。
追加リソース
次のチュートリアルでは、R で他の一般的なタスクを実行する方法について説明します。