相関行列の見方


統計では、2 つの変数間の関係を理解しようとすることがよくあります。

たとえば、学生の勉強時間と試験での成績との関係を理解したい場合があります。

この関係を定量化する 1 つの方法は、2 つの変数間の線形関連性の尺度であるピアソン相関係数を使用することです -1 から 1 までの値を持ちます。ここで、

  • -1 は、2 つの変数間の完全な負の線形相関を示します。
  • 0 は 2 つの変数間に線形相関がないことを示します
  • 1 は、2 つの変数間の完全な正の線形相関を示します。

相関係数がゼロから離れるほど、2 つの変数間の関係が強くなります。

関連: 「強い」相関関係とは何ですか?

しかし場合によっては、変数の複数のペア間の相関関係を理解したいことがあります。このような場合、相関行列を作成できます。これは、いくつかの変数間の相関係数を示す正方形の表です。

相関行列の例

以下の相関行列は、教育関連のいくつかの変数間の相関係数を示しています。

相関行列の例

表の各セルは、2 つの特定の変数間の相関関係を示します。たとえば、以下の強調表示されたセルは、「勉強に費やした時間」と「試験の成績」の相関が0.82であることを示しており、強い正の相関があることを示しています。勉強時間の増加は、試験のスコアの向上と密接に関係しています。

相関行列の読み取り例

また、下の強調表示されたセルは、「勉強に費やした時間」と「睡眠に費やした時間」の間の相関が-0.22であることを示しており、弱い負の相関があることを示しています。勉強時間が増えると、睡眠時間は減ります。

相関行列における負の相関の例

また、下の強調表示されたセルは、「睡眠時間」と「IQ スコア」の相関関係が0.06であることを示しており、基本的に相関関係がないことを示しています。学生の睡眠時間と IQ スコアの間にはほとんど関連性がありません。

相関がない場合の相関行列の例

また、各変数はそれ自体と完全に相関しているため、テーブルの対角線に沿った相関係数はすべて 1 に等しいことに注意してください。これらのセルは解釈には役に立ちません。

相関行列の対角セルの例

相関行列のバリエーション

相関行列は完全に対称であることに注意してください。たとえば、右上のセルには左下のセルとまったく同じ値が表示されます。

対称相関行列の例

実際、2 つのセルは「勉強に費やした時間」と「学校の成績」の相関関係を測定します。

相関行列は対称であるため、行列に表示される相関係数の半分は冗長で不要です。したがって、相関行列の半分しか表示されない場合があります。

相関行列の半分

また、相関係数をさらに読みやすくするために、相関行列がヒート マップのように色付けされることもあります。

ヒートマップ相関行列の例

相関行列を使用する場合

実際には、相関行列は次の 3 つの理由で一般的に使用されます。

1. 相関行列は、一連のデータを簡単に要約します。

相関行列は、データセット内のすべての変数間の相関を要約する簡単な方法です。たとえば、1,000 人の生徒に関する次の情報を含む次のデータセットがあるとします。

相関行列の生データセットの例

生データを見るだけでは、各変数間の関係を理解するのは非常に困難です。幸いなことに、相関行列は、変数の各ペア間の相関関係を迅速に理解するのに役立ちます。

2. 相関行列は回帰の診断として機能します。

重線形回帰の重要な前提の 1 つは、モデル内の独立変数がモデル内の他の変数と強い相関を持たないということです。

2 つの独立変数の相関性が高い場合、多重共線性と呼ばれる問題が発生し、回帰結果の解釈が困難になる可能性があります。

潜在的な多重共線性の問題を特定する最も簡単な方法の 1 つは、相関行列を調べて、変数のいずれかが相互に高度に相関しているかどうかを視覚的に確認することです。

3. 相関行列は、他の分析への入力として使用できます。

相関行列は、探索的因子分析や構造方程式モデルなどの他の複雑な分析の入力として使用されます。

追加リソース

次のチュートリアルでは、さまざまな統計ソフトウェアを使用して相関行列を作成する方法を説明します。

Excel で相関行列を作成する方法
SPSS で相関行列を作成する方法
Stata で相関行列を作成する方法
Python で相関行列を作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です