正态二项式近似:定义和示例


如果_ _ _ _ _

  • µ = np
  • σ = √ np(1-p)

事实证明,如果n足够大,那么我们可以使用正态分布来近似与二项式分布相关的概率。这称为正态二项式近似

要使n “足够大”,它必须满足以下条件:

  • np≥5
  • n(1-p)≥5

当两个条件都满足时,我们就可以使用正态分布来回答与二项式分布相关的概率问题。

然而,正态分布是连续概率分布,而二项分布是离散概率分布,因此在计算概率时需要应用连续性校正。

简而言之,连续性校正是从离散 x 值中添加或减去 0.5 的名称。

例如,假设我们想要计算一枚硬币在 100 次抛掷过程中正面朝上的概率小于或等于 45 次。也就是说,我们要找到 P(X ≤ 45)。要使用正态分布来近似二项式分布,我们需要找到 P(X ≤ 45.5)。

下表显示了何时应该添加或减去 0.5,具体取决于您尝试查找的概率类型:

使用二项式分布 使用具有连续性校正的正态分布
X = 45 44.5 < X < 45.5
X≤45 X < 45.5
X < 45 X < 44.5
X≥45 X > 44.5
X > 45 X > 45.5

以下分步示例演示如何使用正态分布来近似二项式分布。

示例:二项式的正态近似

假设我们想知道抛掷 100 次硬币,正面朝上的次数少于或等于 43 次的概率。

在这种情况下,我们有以下价值观:

  • n (试验次数)= 100
  • X (成功次数)= 43
  • p (给定试验的成功概率)= 0.50

要计算硬币正面朝上少于或等于 43 次的概率,我们可以使用以下步骤:

步骤 1:验证样本量是否足够大,可以使用正态近似值。

首先,我们需要检查是否满足以下条件:

  • np≥5
  • n(1-p)≥5

在这种情况下,我们有:

  • NP = 100*0.5 = 50
  • n(1-p) = 100*(1 – 0.5) = 100*0.5 = 50

两个数字都大于 5,因此我们可以安全地使用正态近似值。

步骤 2:确定要应用的连续性校正。

参考上表,我们发现当处理 X ≤ 43 形式的概率时,我们应该添加 0.5。因此,我们会找到 P(X< 43.5)。

步骤 3:求二项式分布的均值 (μ) 和标准差 (σ)。

µ = n*p = 100*0.5 = 50

σ = √ n*p*(1-p) = √ 100*.5*(1-.5) = √ 25 = 5

步骤 4:使用上一步中找到的平均值和标准差求出 z 分数。

z = (x – μ) / σ = (43.5 – 50) / 5 = -6.5 / 5 = -1.3。

步骤 5:找出与 z 分数相关的概率。

我们可以使用正态 CDF 计算器发现 -1.3 左侧的标准正态曲线下方的面积为0.0968

因此,抛掷 100 次硬币,正面朝上的次数少于或等于 43 次的概率为0.0968


该示例说明了以下内容:

  • 我们遇到过随机变量服从二项式分布的情况。
  • 我们想要找到该随机变量获得特定值的概率。
  • 由于样本量(n = 100 次试验)足够大,我们能够使用正态分布来近似二项式分布。

这是如何使用正态近似来查找与二项式分布相关的概率的完整示例。

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注