人口对比样本标准差:何时使用每个标准差
标准差是衡量数据集中值分布的最常见方法之一。
事实证明,您可以计算两种不同类型的标准差,具体取决于您使用的数据类型。
1.总体标准差
当您使用的数据集代表整个总体(即您感兴趣的每个值)时,您应该计算总体标准差。
计算总体标准差(表示为 σ)的公式为:
σ = √ Σ( xi – μ) 2 / N
金子:
- Σ :表示“和”的符号
- x i :数据集中的第 i个值
- μ :人口平均值
- N :人口规模
2. 标准差示例
当您使用的数据集代表取自较大感兴趣群体的样本时,您应该计算样本标准差。
计算样本标准差(表示为s )的公式为:
s = √ Σ( xi – x̄) 2 / (n – 1)
金子:
- Σ :表示“和”的符号
- x i :数据集中的第 i个值
- x̄ : 样本平均值
- n :样本大小
总体与样本的标准差:差值
从上面的公式中,我们可以看到总体和样本标准差之间存在微小的差异:在计算样本标准差时,我们除以n-1而不是N。
原因是,当我们计算样本标准差时,我们往往会低估真实的总体变异性。换句话说,我们对真实总体标准差的估计是有偏差的。*
为了纠正这种偏差,我们除以 n-1。事实证明,这使得样本标准差成为总体标准差的无偏估计。
*这一点的证明超出了本文的范围。有关数学证明,请参阅这篇 Stack Exchange 文章。
人口对比样本标准差:何时使用每个标准差
使用以下练习题可以更好地理解何时应该使用总体标准差与样本标准差。
练习题1:体育
假设一位篮球教练想要总结其球队 12 名球员得分的平均值和标准差。
在计算得分标准差时,应该使用总体标准差公式还是样本标准差公式?
答案:他必须使用总体标准差,因为他只对自己球员的得分感兴趣,而不对另一支球队的其他球员得分感兴趣。
练习题2:高度
假设一位体育老师想要总结他班上学生身高的平均值和标准差。
计算身高标准差时,应该使用总体标准差公式还是样本标准差公式?
答案:它应该使用总体标准差,因为它只对特定班级的学生人数感兴趣。
练习题3:生物学
假设生物学家想要总结特定种类海龟的体重平均值和标准差。她决定出去从种群中随机抽取 20 只海龟。
在计算权重的标准差时,她应该使用总体标准差公式还是样本标准差公式?
答案:她应该使用样本标准差,因为她对整个海龟种群的重量感兴趣,而不仅仅是样本中海龟的重量。
练习题 4:制造
假设检查员想要汇总某个工厂生产的轮胎重量的平均值和标准差。他决定从工厂随机抽取 40 个轮胎样本,并对每个轮胎进行称重。
计算权重标准差时,应该使用总体标准差公式还是样本标准差公式?
答案:他应该使用样本标准差,因为他感兴趣的是该工厂生产的所有轮胎的重量,而不仅仅是样本中轮胎的重量。
其他资源
以下教程提供有关标准差的其他信息: