如何在 google 表格中创建协方差矩阵
协方差是衡量一个变量的变化与第二个变量的变化如何关联的指标。更具体地说,它是两个变量线性相关程度的度量。
计算两个变量X和Y之间的协方差的公式为:
COV( X , Y ) = Σ(x- x )(y- y ) / n
协方差矩阵是一个方阵,显示许多不同变量之间的协方差。这是了解数据集中不同变量如何关联的有用方法。
以下示例展示了如何在 Google Sheets 中为给定数据集创建协方差矩阵。
如何在 Google 表格中创建协方差矩阵
假设我们有以下数据集,其中显示了 10 名不同学生在数学、科学和历史这三个科目中的测试成绩。
要为此数据集创建协方差矩阵,我们可以使用COVAR()函数,语法如下:
COVAR(数据_y,数据_x)
该数据集的协方差矩阵显示在单元格B15:D17中,而用于创建协方差矩阵的公式显示在下面的单元格B21:D23中:
如何解释协方差矩阵
一旦我们有了协方差矩阵,解释矩阵值就很简单了。
矩阵对角线上的值就是每个受试者的方差。例如:
- 数学成绩的方差为 64.96
- 科学分数的方差为 56.4
- 历史分数方差为 75.56
矩阵的其他值代表不同主体之间的协方差。例如:
- 数学和科学分数之间的协方差为 33.2。
- 数学和历史分数之间的协方差为-24.44。
- 科学和历史分数之间的协方差为-24.1。
协方差为正数表示两个变量倾向于同时增加或减少。例如,数学和科学具有正协方差 (33.2),表明数学得分高的学生也往往在科学得分高。同样,数学成绩不佳的学生在科学方面也往往表现不佳。
协方差为负数表示随着一个变量的增加,第二个变量趋于减少。例如,数学和历史具有负协方差(-24.44),表明数学得分高的学生往往在历史得分较低。同样,数学得分低的学生往往在历史得分高。
其他资源
如何在 Excel 中创建协方差矩阵
如何在 R 中创建协方差矩阵
如何在 Python 中创建协方差矩阵
如何在 SPSS 中创建协方差矩阵