Как создать ковариационную матрицу в r
Ковариация — это мера того, как изменения одной переменной связаны с изменениями второй переменной. Более конкретно, это мера степени линейной связи двух переменных.
Ковариационная матрица — это квадратная матрица, показывающая ковариацию между множеством различных переменных. Это может быть полезным способом понять, как различные переменные связаны в наборе данных.
В следующем примере показано, как создать ковариационную матрицу в R.
Как создать ковариационную матрицу в R
Используйте следующие шаги, чтобы создать ковариационную матрицу в R.
Шаг 1: Создайте фрейм данных.
Сначала мы создадим фрейм данных, содержащий результаты тестов 10 разных учеников по трем предметам: математике, естественным наукам и истории.
#create data frame data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95), science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94), history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78)) #view data frame data math science history 1 84 85 97 2 82 82 94 3 81 72 93 4 89 77 95 5 73 75 88 6 94 89 82 7 92 95 78 8 70 84 84 9 88 77 69 10 95 94 78
Шаг 2: Создайте ковариационную матрицу.
Далее мы создадим ковариационную матрицу для этого набора данных, используя функцию cov() :
#create covariance matrix
cov(data)
math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556
Шаг 3: Интерпретируйте ковариационную матрицу.
Значения по диагоналям матрицы — это просто дисперсии каждого предмета. Например:
- Разница оценок по математике 72,18.
- Дисперсия оценок по естествознанию составляет 62,67.
- Историческая разница в баллах составляет 83,96.
Остальные значения матрицы представляют собой ковариации между разными субъектами. Например:
- Ковариация между оценками по математике и естественным наукам составляет 36,89.
- Ковариация между оценками по математике и истории составляет -27,16.
- Ковариация между оценками по естествознанию и истории составляет -26,78.
Положительное число ковариации указывает на то, что две переменные имеют тенденцию увеличиваться или уменьшаться одновременно. Например, математика и естественные науки имеют положительную ковариацию (36,89), что указывает на то, что учащиеся, набравшие высокие баллы по математике, также имеют тенденцию получать высокие баллы по естественным наукам. И наоборот, учащиеся, которые плохо успевают по математике, также, как правило, плохо успевают по естественным наукам.
Отрицательное число ковариации указывает на то, что по мере увеличения одной переменной вторая переменная имеет тенденцию к уменьшению. Например, математика и история имеют отрицательную ковариацию (-27,16), что указывает на то, что учащиеся с высокими показателями по математике, как правило, имеют низкие результаты по истории. И наоборот, учащиеся с низкими баллами по математике, как правило, получают высокие баллы по истории.
Дополнительные руководства по R можно найти здесь .