Sas で相関行列を作成する方法 (例付き)
相関行列は、データセット内の変数間の 相関係数を示す正方形の表です。
これは、データセット内の変数間に存在する線形関係の強さを理解する簡単な方法を提供します。
SAS でPROC CORRステートメントを使用すると、特定のデータセットの相関行列を作成できます。
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
デフォルトでは、データセット内のすべての数値変数間の相関係数を表示する行列が作成されます。
相関行列に特定の変数のみを含めるには、 VARステートメントを使用できます。
/*create correlation matrix using only var1, var2 and var3 in my_data*/
proc corr data =my_data;
var var1, var2, var3;
run ;
次の例は、SAS で相関行列を作成する方法を示しています。
例: SAS での相関行列の作成
SAS に、さまざまなバスケットボール選手に関する情報を含む次のデータセットがあるとします。
/*create dataset*/
data my_data;
input team $ assists rebounds points;
datalines ;
A 4 12 22
A 5 14 24
A 5 13 26
A 6 7 26
B 7 8 29
B 8 8 32
B 8 9 20
B 10 13 14
;
run ;
/*view dataset*/
proc print data =my_data;
PROC CORRステートメントを使用して、デフォルトでデータセット内のすべての数値変数を含む相関行列を作成できます。
/*create correlation matrix using all numeric variables in my_data*/
proc corr data =my_data;
run ;
出力には、最初のテーブルの数値変数の要約統計量が相関行列とともに表示されます。
「チーム」変数は数値変数ではないため、相関行列には含まれていないことに注意してください。
相関行列の値を解釈する方法は次のとおりです。
(1)アシストとリバウンドの間のピアソン相関係数 (r) は-0.24486です。対応する p 値は0.5589です。
r はゼロより小さいため、これら 2 つの変数間に負の線形関連があることがわかります。ただし、p 値は 0.05 未満ではないため、この相関関係は統計的に有意ではありません。
(2)アシストとポイント間のピアソン相関係数 (r) は-0.32957です。対応する p 値は0.4253です。
これら 2 つの変数の間には負の線形相関がありますが、統計的に有意ではありません。
(3)リバウンドとポイント間のピアソン相関係数 (r) は-0.52209です。対応する p 値は0.1844です。
これら 2 つの変数の間には負の線形相関がありますが、統計的に有意ではありません。
VARステートメントを使用して、相関行列に特定の数値変数のみを含めることもできることに注意してください。
/*create correlation matrix using only assists and rebounds variables*/
proc corr data =my_data;
var assists rebounds;
run ;
この相関行列にはアシスト変数とリバウンド変数のみが含まれていることに注意してください。
追加リソース
次のチュートリアルでは、SAS で他の一般的なタスクを実行する方法について説明します。
SAS で散布図行列を作成する方法
SAS でピボットテーブルを作成する方法
SAS で Variance Inflation Factor (VIF) を計算する方法