Как читать ковариационную матрицу


Ковариация — это мера того, как изменения одной переменной связаны с изменениями второй переменной. Более конкретно, это мера степени линейной связи двух переменных.

Ковариационная матрица — это квадратная матрица, показывающая ковариацию между множеством различных переменных. Это может быть полезным способом понять, как различные переменные связаны в наборе данных.

В следующем примере показано, как читать ковариационную матрицу на практике.

Как читать ковариационную матрицу

Предположим, у нас есть следующая ковариационная матрица, содержащая информацию об экзаменационных баллах учащихся по трем различным предметам:


Значения по диагоналям матрицы представляют собой дисперсии каждого предмета.

Например:

  • Дисперсия результатов математических вычислений составляет 64,9 .
  • Дисперсия оценок по естествознанию составляет 56,4 .
  • Дисперсия исторических оценок составляет 75,6 .

Остальные значения матрицы представляют собой ковариации между разными субъектами.

Например:

  • Ковариация между оценками по математике и естественным наукам составляет 33,2 .
  • Ковариация между оценками по математике и истории составляет –24,4 .
  • Ковариация между оценками по естествознанию и истории составляет –24,1 .

Положительное число ковариации указывает на то, что две переменные имеют тенденцию увеличиваться или уменьшаться одновременно.

Например, математика и естественные науки имеют положительную ковариацию ( 33,2 ), что указывает на то, что учащиеся, набравшие высокие баллы по математике, также имеют тенденцию получать высокие баллы по естественным наукам.

И наоборот, учащиеся, которые плохо успевают по математике, также, как правило, плохо успевают по естественным наукам.

Отрицательное число ковариации указывает на то, что по мере увеличения одной переменной вторая переменная имеет тенденцию к уменьшению.

Например, математика и история имеют отрицательную ковариацию ( -24,44 ), что указывает на то, что учащиеся с высокими показателями по математике, как правило, имеют низкие результаты по истории.

И наоборот, учащиеся с низкими баллами по математике, как правило, получают высокие баллы по истории.

Замечание о симметрии ковариационной матрицы

Следует отметить, что ковариационная матрица совершенно симметрична.

Например, в верхней правой ячейке отображается точно то же значение, что и в нижней левой ячейке:

Действительно, эти две ячейки измеряют ковариацию между историей и математикой.

Поскольку ковариационная матрица симметрична, половина значений ковариации, отображаемых в матрице, являются избыточными и ненужными.

Итак, иногда отображается только половина ковариационной матрицы:

Когда использовать ковариационную матрицу

На практике вам часто придется создавать и интерпретировать матрицу корреляции чаще, чем ковариационную матрицу.

Однако ковариационные матрицы часто используются «под капотом» для различных алгоритмов и моделей машинного обучения.

Например, ковариационная матрица используется при анализе главных компонентов , что помогает нам понять основные закономерности в наборе данных, содержащем большое количество переменных.

Дополнительные ресурсы

В следующих руководствах объясняется, как создать ковариационную матрицу с использованием различного статистического программного обеспечения:

Как создать ковариационную матрицу в R
Как создать ковариационную матрицу в Python
Как создать ковариационную матрицу в SPSS
Как создать ковариационную матрицу в Excel

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *