如何在 excel 中创建协方差矩阵


协方差是衡量一个变量的变化与第二个变量的变化如何关联的指标。更具体地说,它是两个变量线性相关程度的度量。

计算两个变量XY之间的协方差的公式为:

COV( X , Y ) = Σ(x- x )(y- y ) / n

协方差矩阵是一个方阵,显示许多不同变量之间的协方差。这是理解数据集中不同变量如何关联的一种简单而有用的方法。

以下示例演示如何使用简单的数据集在 Excel 中创建协方差矩阵。

如何在 Excel 中创建协方差矩阵

假设我们有以下数据集,其中显示了 10 名不同学生在数学、科学和历史这三个科目中的测试成绩。

要为此数据集创建协方差矩阵,请单击 Excel 右上角“数据”选项卡下的“数据分析”选项。

Excel 中的分析工具集

注意:如果您没有看到“数据分析”选项,则必须首先加载“数据分析工具库”

单击此选项后,将出现一个新窗口。单击协方差

“输入范围”框中,键入“$A$1:$C$11”,因为这是我们的数据集所在的单元格范围。选中第一行中的标签框,告诉 Excel 我们的变量的标签位于第一行。然后,在“输出范围”框中,键入要在其中显示协方差矩阵的任何单元格。我的细胞是$E$2。然后单击“确定”

协方差矩阵是自动生成的并出现在单元格$E$2中:

如何解释协方差矩阵

一旦我们有了协方差矩阵,解释矩阵的值就非常简单了。

矩阵对角线上的值就是每个受试者的方差。例如:

  • 数学成绩的方差为 64.96
  • 科学分数的方差为 56.4
  • 历史分数方差为 75.56

矩阵的其他值代表不同主体之间的协方差。例如:

  • 数学和科学分数之间的协方差为 33.2。
  • 数学和历史分数之间的协方差为-24.44。
  • 科学和历史分数之间的协方差为-24.1。

协方差为正数表示两个变量倾向于同时增加或减少。例如,数学和科学具有正协方差 (33.2),表明数学得分高的学生也往往在科学得分高。同样,数学成绩不佳的学生在科学方面也往往表现不佳。

协方差为负数表示随着一个变量的增加,第二个变量趋于减少。例如,数学和历史具有负协方差(-24.44),表明数学得分高的学生往往在历史得分较低。同样,数学得分低的学生往往在历史得分高。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注