R で共分散行列を作成する方法


共分散は、 1 つの変数の変化が 2 番目の変数の変化とどのように関連しているかを示す尺度です。より具体的には、これは 2 つの変数が線形に関連している程度の尺度です。

共分散行列は、多くの異なる変数間の共分散を示す正方行列です。これは、データ セット内でさまざまな変数がどのように関連しているかを理解するのに役立ちます。

次の例は、R で共分散行列を作成する方法を示しています。

R で共分散行列を作成する方法

R で共分散行列を作成するには、次の手順を使用します。

ステップ 1: データ フレームを作成します。

まず、数学、科学、歴史の 3 つの科目における 10 人の異なる生徒のテストのスコアを含むデータ フレームを作成します。

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

ステップ 2: 共分散行列を作成します。

次に、 cov()関数を使用して、このデータセットの共分散行列を作成します。

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

ステップ 3: 共分散行列を解釈します。

マトリックスの対角に沿った値は、単に各被験者の分散です。例えば:

  • 数学の得点の分散は 72.18 です
  • 科学の得点の分散は 62.67 です
  • 過去のスコア分散は 83.96 です

行列の他の値は、異なる被験者間の共分散を表します。例えば:

  • 数学と科学のスコア間の共分散は 36.89 です。
  • 数学と歴史の得点間の共分散は -27.16 です。
  • 科学スコアと歴史スコアの間の共分散は -26.78 です。

共分散の正の数は、 2 つの変数が並行して増加または減少する傾向があることを示します。たとえば、数学と科学には正の共分散 (36.89) があり、数学の得点が高い生徒は科学の得点も高い傾向があることを示しています。逆に、数学の成績が悪い生徒は、科学の成績も悪い傾向があります。

共分散の負の値は、 1 つの変数が増加すると、2 番目の変数が減少する傾向があることを示します。たとえば、数学と歴史には負の共分散 (-27.16) があり、数学の成績が高い生徒は歴史の成績が低い傾向があることを示しています。逆に、数学の得点が低い生徒は歴史の得点が高くなる傾向があります。

その他の R チュートリアルはここで見つけることができます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です