Excel で共分散行列を作成する方法
共分散は、 1 つの変数の変化が 2 番目の変数の変化とどのように関連しているかを示す尺度です。より具体的には、これは 2 つの変数が線形に関連している程度の尺度です。
2 つの変数XとYの間の共分散を計算する式は次のとおりです。
COV( X , Y ) = Σ(x- x )(y- y ) / n
共分散行列は、多くの異なる変数間の共分散を示す正方行列です。これは、データセット内でさまざまな変数がどのように関連しているかを理解するための簡単で便利な方法です。
次の例は、単純なデータ セットを使用して Excel で共分散行列を作成する方法を示しています。
Excel で共分散行列を作成する方法
数学、科学、歴史の 3 科目における 10 人の異なる生徒のテストのスコアを示す次のデータセットがあるとします。
このデータ セットの共分散行列を作成するには、Excel の右上にある[データ]タブの下にある[データ分析]オプションをクリックします。
注: [データ分析] オプションが表示されない場合は、まずデータ分析ツールパックをロードする必要があります。
このオプションをクリックすると、新しいウィンドウが表示されます。 [共分散]をクリックします。
[入力範囲]ボックスに「$A$1:$C$11」と入力します。これは、データセットが配置されているセルの範囲です。 [最初の行のラベル] ボックスをオンにして、変数のラベルが最初の行にあることを Excel に指示します。次に、 [出力範囲]ボックスに、共分散行列を表示する任意のセルを入力します。セル $E$2 だと思います。次に、 「OK」をクリックします。
共分散行列が自動的に生成され、セル $E$2 に表示されます。
共分散行列を解釈する方法
共分散行列を取得したら、行列の値を解釈するのは非常に簡単です。
マトリックスの対角に沿った値は、単に各被験者の分散です。例えば:
- 数学の得点の分散は 64.96 です
- 科学の得点の分散は 56.4 です
- 過去のスコア分散は 75.56 です
行列の他の値は、異なる被験者間の共分散を表します。例えば:
- 数学と科学のスコア間の共分散は 33.2 です。
- 数学と歴史のスコア間の共分散は -24.44 です。
- 科学スコアと歴史スコアの間の共分散は -24.1 です。
共分散の正の数は、 2 つの変数が並行して増加または減少する傾向があることを示します。たとえば、数学と科学には正の共分散 (33.2) があり、数学の得点が高い生徒は科学の得点も高い傾向があることを示しています。同様に、数学の成績が悪い生徒は、科学の成績も悪い傾向があります。
共分散の負の値は、 1 つの変数が増加すると、2 番目の変数が減少する傾向があることを示します。たとえば、数学と歴史には負の共分散 (-24.44) があり、数学の得点が高い生徒は歴史の得点が低い傾向があることを示しています。同様に、数学の得点が低い生徒は歴史の得点が高くなる傾向があります。