Excel 中的 covariance.p 与 covariance.s:有什么区别?
在统计学中,协方差是一种衡量一个变量的变化与另一个变量的变化如何关联的方法。
正协方差值表示一个变量的增加与另一变量的增加相关。
负值表示一个变量的增加与另一变量的减少相关。
您可以使用两种不同的函数来计算 Excel 中的协方差:
1. COVARIANCE.P:该函数计算总体协方差。当值的范围代表整个总体时使用此函数。
该函数使用以下公式:
总体协方差 = Σ(x i – x )(y i – y ) / n
金子:
- Σ:希腊符号,意思是“和”
- x i :变量 x 的第 i个值
- x :变量 x 的平均值
- y i :变量 y 的第 i 个值
- y :变量 y 的平均值
- n:观察总数
2. COVARIANCE.S:该函数计算样本协方差。当值范围代表值样本而不是整个总体时,请使用此函数。
该函数使用以下公式:
样本协方差 = Σ(x i – x )(y i – y ) / (n-1)
金子:
- Σ:希腊符号,意思是“和”
- x i :变量 x 的第 i个值
- x :变量 x 的平均值
- y i :变量 y 的第 i 个值
- y :变量 y 的平均值
- n:观察总数
请注意两个公式之间的细微差别: COVARIANCE.P除以n而COVARIANCE.S除以n-1 。
因此, COVARIANCE.S公式将始终产生较大的值,因为它除以较小的值。
以下示例展示了如何在实践中使用每个公式。
示例:Excel 中的 COVARIANCE.P 与 COVARIANCE.S
假设我们在 Excel 中有以下数据集,其中显示了 15 名不同篮球运动员的得分和助攻:
以下屏幕截图显示了如何使用两种不同的协方差公式计算得分和助攻之间的协方差:
样本协方差为15.69 ,总体协方差为14.64 。
正如前面提到的,样本协方差总是大于总体协方差。
何时使用 COVARIANCE.P 或 COVARIANCE.S
在大多数情况下,我们无法收集整个人群的数据。因此,我们仅收集人口样本的数据。
因此,我们几乎总是使用COVARIANCE.S来计算数据集的协方差,因为我们的数据集通常代表一个样本。
在极少数情况下,您的数据代表整个总体,您可以改用COVARIANCE.P函数。
其他资源
以下教程解释了其他常用 Excel 函数的区别:
Excel 中的 STDEV.P 与 STDEV.S:有什么区别?
Excel 中的 PERCENTILE.EXC 与 PERCENTILE.INC:有什么区别?
Excel 中的 QUARTILE.EXC 与 QUARTILE.INC:有什么区别?