样本量与误差幅度之间的关系
在统计学中,我们经常想要估计某些总体参数的值,例如总体比例或总体平均值。
为了估计这些值,我们通常收集一个简单的随机样本并计算样本比例或样本均值。
然后,我们构建一个置信区间来捕获这些估计的不确定性。
我们使用以下公式来计算总体比例的置信区间:
置信区间 = p ± z*√ p(1-p) / n
金子:
- p:样本比例
- z:选择的z值
- n:样本量
我们使用以下公式来计算总体平均值的置信区间:
置信区间 = x̄ ± z*(s/√ n )
金子:
- x̄:样本均值
- z:选择的z值
- s :样本标准差
- n:样本量
在这两个公式中,样本量和误差幅度之间存在反比关系。
样本量越大,误差范围越小。相反,样本量越小,误差幅度就越大。
查看以下两个示例以更好地理解这一点。
示例 1:总体比例的样本量和误差范围
我们使用以下公式来计算总体比例的置信区间:
置信区间 = p ± z*√ p(1-p) / n
红色部分称为误差幅度:
置信区间 = p ± z*√ p(1-p) / n
请注意,在误差范围内,我们除以 n(样本大小)。
因此,当样本量很大时,我们除以一个很大的数字,这会减少总误差范围。这导致置信区间变窄。
例如,假设我们收集具有以下信息的简单随机数据样本:
- 值: 0.6
- 人数: 25
以下是计算总体比例 95% 置信区间的方法:
- 置信区间 = p ± z*√ p(1-p) / n
- 置信区间 = 0.6 ± 1.96*√ 0.6(1-0.6) / 25
- 置信区间 = 0.6 ± 0.192
- 置信区间 = [.408, .792]
现在考虑我们是否使用 200 的样本量。以下是我们计算总体比例 95% 置信区间的方法:
- 置信区间 = p ± z*√ p(1-p) / n
- 置信区间 = 0.6 ± 1.96*√ 0.6(1-0.6) / 200
- 置信区间 = 0.6 ± 0.068
- 置信区间 = [.532, .668]
请注意,通过简单地增加样本量,我们能够减少误差幅度并产生更窄的置信区间。
示例 2:总体平均值的样本量和误差范围
我们使用以下公式计算总体平均值的置信区间:
置信区间 = x̄ ± z*(s/√ n )
红色部分称为误差幅度:
置信区间 = x̄ ± z*(s/√ n )
请注意,在误差范围内,我们除以 n(样本大小)。
因此,当样本量很大时,我们除以一个很大的数字,这会减少总误差范围。这导致置信区间变窄。
例如,假设我们收集具有以下信息的简单随机数据样本:
- x̄: 15
- 秒:4
- 人数: 25
以下是计算总体平均值 95% 置信区间的方法:
- 置信区间 = x̄ ± z*(s/√ n )
- 置信区间 = 15 ± 1.96*(4/√ 25 )
- 置信区间 = 15 ± 1.568
- 置信区间 = [13.432, 16.568]
现在考虑我们是否使用 200 个样本量。以下是我们计算总体平均值的 95% 置信区间的方法:
- 置信区间 = x̄ ± z*(s/√ n )
- 置信区间 = 15 ± 1.96*(4/√ 200 )
- 置信区间 = 15 ± 0.554
- 置信区间 = [14.446, 15.554]
请注意,通过简单地增加样本量,我们能够减少误差幅度并产生更窄的置信区间。
其他资源
以下教程提供有关比例置信区间的其他信息:
以下教程提供有关均值置信区间的其他信息: