样本方差对比人口差异:有什么区别?
方差是衡量数据集中值分布的一种方法。
总体方差的计算公式为:
σ 2 = Σ ( xi – μ) 2 / N
金子:
- Σ :表示“和”的符号
- μ :人口平均值
- x i :总体中的第 i个元素
- N :人口规模
样本方差的计算公式为:
s 2 = Σ ( xi – x ) 2 / (n-1)
金子:
- x :样本平均值
- x i :样本的第 i个元素
- n :样本量
请注意,两个公式之间只有很小的差异:
当我们计算总体方差时,我们除以N (总体规模)。
当我们计算样本方差时,我们除以n-1 (样本大小 – 1)。
在计算样本方差时,我们应用所谓的贝塞尔校正,即除以 n-1。
在不陷入数学细节的情况下,除以 n-1 可能会证明可以提供总体方差的无偏估计,这也是我们通常感兴趣的值。
何时计算样本方差与总体方差
如果您不确定是计算样本方差还是总体方差,请记住以下一般规则:
当您使用的数据集代表取自较大感兴趣总体的样本时,您应该计算样本方差。
当您使用的数据集代表整个总体(即您感兴趣的每个值)时,您应该计算总体方差。
以下示例显示了计算样本方差与总体方差的不同场景。
示例:计算样本方差
假设植物学家想要计算某种植物物种的高度变化。由于一个地区有数千株植物,她决定对 20 株植物进行简单的随机抽样,并测量它们的高度。
在这种情况下,植物学家必须计算样本方差,因为他对整个植物种群的方差感兴趣,但只是使用该样本来估计真实的种群方差。
示例:计算总体方差
假设一位老师想要计算他班上 20 名学生考试成绩的方差。
在这种情况下,教师必须计算总体方差,因为他正在使用的数据集(20 个考试结果)代表了整个感兴趣的总体。
其他资源
以下教程介绍了如何在不同的统计软件中计算样本方差和总体方差: