Sas で相関関係を計算する方法 (例付き)
2 つの変数間の関係を定量化する 1 つの方法は、2 つの変数間の線形関連を測定する ピアソン相関係数を使用することです。
常に -1 から 1 までの値を取ります。
- -1 は、2 つの変数間の完全な負の線形相関を示します。
- 0 は 2 つの変数間に線形相関がないことを示します
- 1 は、2 つの変数間の完全な正の線形相関を示します。
相関係数がゼロから離れるほど、2 つの変数間の関係が強くなります。
次の例は、SAS でproc corrを使用して、 Fishと呼ばれる SAS 統合データセット内の変数間の相関係数を計算する方法を示しています。このデータセットには、フィンランドの湖で捕れた 159 匹の異なる魚のさまざまな測定値が含まれています。
proc printを使用して、このデータセットの最初の 10 個の観測値を表示できます。
/*view first 10 observations from Fish dataset*/ proc print data =sashelp.Fish( obs = 10 ); run ;
例 1: 2 つの変数間の相関関係
次のコードを使用して、高さ変数と幅変数の間のピアソン相関係数を計算できます。
/*calculate correlation coefficient between Height and Width*/ proc corr data =sashelp.fish; var HeightWidth; run ;
最初の表には、高さと幅に関する要約統計が表示されます。
2 番目の表には、相関関係が統計的に有意かどうかを示すp 値を含む、2 つの変数間のピアソン相関係数が表示されます。
結果から次のことがわかります。
- ピアソン相関係数: 0.79288
- P 値: <0.0001
これは、高さと幅の間に強い正の相関関係があり、p 値が α = 0.05 未満であるため、相関関係が統計的に有意であることを示しています。
関連: 「強い」相関関係とは何ですか?
例 2: すべての変数間の相関
次のコードを使用して、データセット内の変数のすべてのペアごとの組み合わせ間のピアソン相関係数を計算できます。
/*calculate correlation coefficient between all pairwise combinations of variables*/ proc corr data =sashelp.fish; run;
結果には、データセット内の数値変数のペアごとの組み合わせごとに、ピアソン相関係数と対応する p 値を含む相関行列が表示されます。
例えば:
- 重さと長さ 1 の間のピアソン相関係数は0.91644 です。
- 重さと長さ 2 の間のピアソン相関係数は0.91937 です。
- 体重と長さ 3 の間のピアソン相関係数は0.92447 です。
等々。
例 3: 散布図を使用して相関関係を視覚化する
また、関数 Lotsを使用して散布図を作成し、2 つの変数間の相関関係を視覚化することもできます。
/*visualize correlation between Height and Width*/ proc corr data =sashelp.fish plots =scatter( nvar =all);; var HeightWidth; run;
グラフでは、高さと幅の間に強い正の相関があることがわかります。高さが増加すると、幅も増加する傾向があります。
グラフの左上隅には、使用された観測値の合計、相関係数、および相関係数の p 値も表示されます。
追加リソース
次のチュートリアルでは、SAS で他の一般的な操作を実行する方法について説明します。