如何在 r 中创建协方差矩阵


协方差是衡量一个变量的变化与第二个变量的变化如何关联的指标。更具体地说,它是两个变量线性相关程度的度量。

协方差矩阵是一个方阵,显示许多不同变量之间的协方差。这是了解数据集中不同变量如何关联的有用方法。

以下示例演示如何在 R 中创建协方差矩阵。

如何在 R 中创建协方差矩阵

使用以下步骤在 R 中创建协方差矩阵。

步骤 1:创建数据框。

首先,我们将创建一个数据框,其中包含 10 名不同学生在数学、科学和历史这三个科目中的测试成绩。

 #create data frame
data <- data.frame(math = c(84, 82, 81, 89, 73, 94, 92, 70, 88, 95),
                   science = c(85, 82, 72, 77, 75, 89, 95, 84, 77, 94),
                   history = c(97, 94, 93, 95, 88, 82, 78, 84, 69, 78))

#view data frame
data

   math science history
1 84 85 97
2 82 82 94
3 81 72 93
4 89 77 95
5 73 75 88
6 94 89 82
7 92 95 78
8 70 84 84
9 88 77 69
10 95 94 78

步骤 2:创建协方差矩阵。

接下来,我们将使用cov()函数为此数据集创建协方差矩阵:

 #create covariance matrix
cov(data)

             math science history
math 72.17778 36.88889 -27.15556
science 36.88889 62.66667 -26.77778
history -27.15556 -26.77778 83.95556

步骤 3:解释协方差矩阵。

矩阵对角线上的值就是每个受试者的方差。例如:

  • 数学成绩的方差为 72.18
  • 科学分数的方差为 62.67
  • 历史分数方差为 83.96

矩阵的其他值代表不同主体之间的协方差。例如:

  • 数学和科学分数之间的协方差为 36.89。
  • 数学和历史分数之间的协方差为-27.16。
  • 科学和历史分数之间的协方差为-26.78。

协方差为正数表示两个变量倾向于同时增加或减少。例如,数学和科学具有正协方差 (36.89),表明数学得分高的学生也往往在科学得分高。相反,数学成绩不佳的学生在科学方面也往往表现不佳。

方差为负数表示随着一个变量的增加,第二个变量趋于减少。例如,数学和历史具有负协方差(-27.16),表明数学成绩较高的学生往往在历史成绩较低。相反,数学成绩低的学生往往历史成绩高。

您可以在此处找到更多 R 教程。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注