Как создать ковариационную матрицу в r


Ковариация — это мера того, как изменения одной переменной связаны с изменениями второй переменной. Более конкретно, это мера степени линейной связи двух переменных.

Ковариационная матрица — это квадратная матрица, показывающая ковариацию между множеством различных переменных. Это может быть полезным способом понять, как различные переменные связаны в наборе данных.

В следующем примере показано, как создать ковариационную матрицу в R.

Как создать ковариационную матрицу в R

Используйте следующие шаги, чтобы создать ковариационную матрицу в R.

Шаг 1: Создайте фрейм данных.

Сначала мы создадим фрейм данных, содержащий результаты тестов 10 разных учеников по трем предметам: математике, естественным наукам и истории.

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

Шаг 2: Создайте ковариационную матрицу.

Далее мы создадим ковариационную матрицу для этого набора данных, используя функцию cov() :

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

Шаг 3: Интерпретируйте ковариационную матрицу.

Значения по диагоналям матрицы — это просто дисперсии каждого предмета. Например:

  • Разница оценок по математике 72,18.
  • Дисперсия оценок по естествознанию составляет 62,67.
  • Историческая разница в баллах составляет 83,96.

Остальные значения матрицы представляют собой ковариации между разными субъектами. Например:

  • Ковариация между оценками по математике и естественным наукам составляет 36,89.
  • Ковариация между оценками по математике и истории составляет -27,16.
  • Ковариация между оценками по естествознанию и истории составляет -26,78.

Положительное число ковариации указывает на то, что две переменные имеют тенденцию увеличиваться или уменьшаться одновременно. Например, математика и естественные науки имеют положительную ковариацию (36,89), что указывает на то, что учащиеся, набравшие высокие баллы по математике, также имеют тенденцию получать высокие баллы по естественным наукам. И наоборот, учащиеся, которые плохо успевают по математике, также, как правило, плохо успевают по естественным наукам.

Отрицательное число ковариации указывает на то, что по мере увеличения одной переменной вторая переменная имеет тенденцию к уменьшению. Например, математика и история имеют отрицательную ковариацию (-27,16), что указывает на то, что учащиеся с высокими показателями по математике, как правило, имеют низкие результаты по истории. И наоборот, учащиеся с низкими баллами по математике, как правило, получают высокие баллы по истории.

Дополнительные руководства по R можно найти здесь .

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *