样本方差对比人口差异:有什么区别?


方差是衡量数据集中值分布的一种方法。

总体方差的计算公式为:

σ 2 = Σ ( xi – μ) 2 / N

金子:

  • Σ :表示“和”的符号
  • μ :人口平均值
  • x i :总体中的第 i元素
  • N :人口规模

样本方差的计算公式为:

s 2 = Σ ( xix ) 2 / (n-1)

金子:

  • x :样本平均值
  • x i :样本的第 i元素
  • n :样本量

请注意,两个公式之间只有很小的差异:

当我们计算总体方差时,我们除以N (总体规模)。

当我们计算样本方差时,我们除以n-1 (样本大小 – 1)。

在计算样本方差时,我们应用所谓的贝塞尔校正,即除以 n-1。

在不陷入数学细节的情况下,除以 n-1 可能会证明可以提供总体方差的无偏估计,这也是我们通常感兴趣的值。

何时计算样本方差与总体方差

如果您不确定是计算样本方差还是总体方差,请记住以下一般规则:

当您使用的数据集代表取自较大感兴趣总体的样本时,您应该计算样本方差

当您使用的数据集代表整个总体(即您感兴趣的每个值)时,您应该计算总体方差

以下示例显示了计算样本方差与总体方差的不同场景。

示例:计算样本方差

假设植物学家想要计算某种植物物种的高度变化。由于一个地区有数千株植物,她决定对 20 株植物进行简单的随机抽样,并测量它们的高度。

在这种情况下,植物学家必须计算样本方差,因为他对整个植物种群的方差感兴趣,但只是使用该样本来估计真实的种群方差。

示例:计算总体方差

假设一位老师想要计算他班上 20 名学生考试成绩的方差。

在这种情况下,教师必须计算总体方差,因为他正在使用的数据集(20 个考试结果)代表了整个感兴趣的总体。

其他资源

以下教程介绍了如何在不同的统计软件中计算样本方差和总体方差:

如何在 Excel 中计算样本和总体方差
如何在 R 中计算样本和总体方差
如何用Python计算样本方差和总体方差

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注