如何在 google 表格中创建相关矩阵
量化两个变量之间关系的一种方法是使用Pearson 相关系数,它是两个变量之间线性关联的度量。它的值介于 -1 和 1 之间,其中:
- -1 表示两个变量之间完全负线性相关
- 0 表示两个变量之间不存在线性相关
- 1 表示两个变量之间存在完全正线性相关
相关系数离零越远,两个变量之间的相关性越强。
但在某些情况下,我们想要了解多对变量之间的相关性。在这些情况下,我们可以创建一个相关矩阵,它是一个方表,显示变量的多个成对组合之间的相关系数。
本教程介绍如何在 Google 表格中创建和解释相关矩阵。
如何在 Google 表格中创建相关矩阵
假设我们有以下数据集,显示 10 名篮球运动员的平均得分、篮板和助攻数:
要为此数据集创建相关矩阵,我们可以使用CORREL()函数,语法如下:
COVAR(数据_y,数据_x)
该数据集的协方差矩阵显示在单元格B15:D17中,而用于创建协方差矩阵的公式显示在下面的单元格B21:D23中:
如何解释相关矩阵
相关矩阵各个单元格中的值告诉我们每个变量成对组合之间的皮尔逊相关系数。例如:
得分和篮板之间的相关性: -0.0464。得分和篮板略有负相关,但该值非常接近于零,以至于没有强有力的证据表明这两个变量之间存在显着关联。
得分和助攻之间的相关性: 0.1219。得分和助攻略有正相关,但这个值也非常接近于零,因此没有强有力的证据表明这两个变量之间存在显着关联。
篮板和助攻之间的相关性: 0.7137。篮板球和助攻呈强正相关。也就是说,拥有更多篮板的球员往往也有更多的助攻。
请注意,相关矩阵的对角线值全部为 1,因为变量与其自身之间的相关性始终为 1。在实践中,这个数字对于解释没有什么用处。