样本量与误差幅度之间的关系


在统计学中,我们经常想要估计某些总体参数的值,例如总体比例总体平均值

为了估计这些值,我们通常收集一个简单的随机样本并计算样本比例或样本均值。

然后,我们构建一个置信区间来捕获这些估计的不确定性。

我们使用以下公式来计算总体比例的置信区间:

置信区间 = p ± z*√ p(1-p) / n

金子:

  • p:样本比例
  • z:选择的z值
  • n:样本量

我们使用以下公式来计算总体平均值的置信区间:

置信区间 = x̄ ± z*(s/√ n )

金子:

  • x̄:样本均值
  • z:选择的z值
  • s :样本标准差
  • n:样本量

在这两个公式中,样本量和误差幅度之间存在反比关系。

样本量越大,误差范围越小。相反,样本量越小,误差幅度就越大。

查看以下两个示例以更好地理解这一点。

示例 1:总体比例的样本量和误差范围

我们使用以下公式来计算总体比例的置信区间:

置信区间 = p ± z*√ p(1-p) / n

红色部分称为误差幅度

置信区间 = p ± z*√ p(1-p) / n

请注意,在误差范围内,我们除以 n(样本大小)。

因此,当样本量很大时,我们除以一个很大的数字,这会减少总误差范围。这导致置信区间变窄。

例如,假设我们收集具有以下信息的简单随机数据样本:

  • 值: 0.6
  • 人数: 25

以下是计算总体比例 95% 置信区间的方法:

  • 置信区间 = p ± z*√ p(1-p) / n
  • 置信区间 = 0.6 ± 1.96*√ 0.6(1-0.6) / 25
  • 置信区间 = 0.6 ± 0.192
  • 置信区间 = [.408, .792]

现在考虑我们是否使用 200 的样本量。以下是我们计算总体比例 95% 置信区间的方法:

  • 置信区间 = p ± z*√ p(1-p) / n
  • 置信区间 = 0.6 ± 1.96*√ 0.6(1-0.6) / 200
  • 置信区间 = 0.6 ± 0.068
  • 置信区间 = [.532, .668]

请注意,通过简单地增加样本量,我们能够减少误差幅度并产生更窄的置信区间。

示例 2:总体平均值的样本量和误差范围

我们使用以下公式计算总体平均值的置信区间:

置信区间 = x̄ ± z*(s/√ n )

红色部分称为误差幅度

置信区间 = x̄ ± z*(s/√ n )

请注意,在误差范围内,我们除以 n(样本大小)。

因此,当样本量很大时,我们除以一个很大的数字,这会减少总误差范围。这导致置信区间变窄。

例如,假设我们收集具有以下信息的简单随机数据样本:

  • x̄: 15
  • :4
  • 人数: 25

以下是计算总体平均值 95% 置信区间的方法:

  • 置信区间 = x̄ ± z*(s/√ n )
  • 置信区间 = 15 ± 1.96*(4/√ 25 )
  • 置信区间 = 15 ± 1.568
  • 置信区间 = [13.432, 16.568]

现在考虑我们是否使用 200 个样本量。以下是我们计算总体平均值的 95% 置信区间的方法:

  • 置信区间 = x̄ ± z*(s/√ n )
  • 置信区间 = 15 ± 1.96*(4/√ 200 )
  • 置信区间 = 15 ± 0.554
  • 置信区间 = [14.446, 15.554]

请注意,通过简单地增加样本量,我们能够减少误差幅度并产生更窄的置信区间。

其他资源

以下教程提供有关比例置信区间的其他信息:

以下教程提供有关均值置信区间的其他信息:

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注