什么是抽样变异性?定义与示例
在统计中,我们通常想要回答以下问题:
- 某个州的平均家庭收入是多少?
- 某种乌龟的平均重量是多少?
- 大学橄榄球比赛的平均上座率是多少?
在每种情况下,我们都想回答一个关于总体的问题,它代表了我们想要测量的所有可能的单个元素。
然而,我们不是收集人口中每个个体的数据,而是收集人口样本的数据,该样本代表总人口的一部分。
例如,我们可能想知道某种乌龟品种的平均重量,该乌龟种群总数为 800 只。
由于定位和称量种群中每只海龟的时间太长,因此我们收集了 30 只海龟的简单随机样本并对其进行称重:
然后,我们可以使用该海龟样本的平均重量来估计种群中所有海龟的平均重量。
抽样变异性是指样本之间的平均值会有所不同。
例如,在 30 只海龟的随机样本中,样本平均值可能为 350 磅。在另一个随机样本中,样本均值可能是 345 磅。在又一个样本中,样本平均值可能是 355 磅。
样本均值之间存在变异性。
如何测量抽样变异性
在实践中,我们仅收集单个样本来估计总体参数。例如,我们只会收集 30 只海龟的单个样本来估计整个海龟种群的平均重量。
这意味着我们只会计算一个样本均值 ( x ) 并用它来估计总体均值 (μ)。
样本均值 = x
但我们知道样本均值因样本而异。因此,为了考虑这种变异性,我们可以使用以下公式来估计样本均值的标准差:
样本均值的标准差 = s/ √n
金子:
- s:样本的标准差
- n:样本量
例如,假设我们收集了 30 只海龟的样本,发现样本的平均重量为 350 磅,样本的标准差为 12 磅。根据这些数字,我们将计算:
样本平均值 = 350 本书
样本平均值的标准差 = 12 / √ 30 = 2.19 磅
这意味着我们对所有海龟的真实种群平均重量的最佳估计是 350 磅,但我们应该预期样本平均值会随标准差约为 2.19 磅而变化。
样本均值标准差的一个有趣特性是,当我们使用越来越大的样本量时,它自然会变小。
例如,假设我们收集了 100 只海龟的样本,发现样本平均体重为 350 磅,样本标准差为 12 磅。样本均值的标准差计算如下:
样本平均值的标准差 = 12 / √ 100 = 1.2 磅
我们对样本均值的最佳估计仍为 350 磅,但我们可以预期从一个 100 只海龟样本到下一个 100 只海龟样本的均值变化只有 1.2 磅的一个标准差。
换句话说,当样本量较大时,样本均值之间的变异性较小。