正态二项式近似:定义和示例
- µ = np
- σ = √ np(1-p)
事实证明,如果n足够大,那么我们可以使用正态分布来近似与二项式分布相关的概率。这称为正态二项式近似。
要使n “足够大”,它必须满足以下条件:
- np≥5
- n(1-p)≥5
当两个条件都满足时,我们就可以使用正态分布来回答与二项式分布相关的概率问题。
然而,正态分布是连续概率分布,而二项分布是离散概率分布,因此在计算概率时需要应用连续性校正。
简而言之,连续性校正是从离散 x 值中添加或减去 0.5 的名称。
例如,假设我们想要计算一枚硬币在 100 次抛掷过程中正面朝上的概率小于或等于 45 次。也就是说,我们要找到 P(X ≤ 45)。要使用正态分布来近似二项式分布,我们需要找到 P(X ≤ 45.5)。
下表显示了何时应该添加或减去 0.5,具体取决于您尝试查找的概率类型:
使用二项式分布 | 使用具有连续性校正的正态分布 |
---|---|
X = 45 | 44.5 < X < 45.5 |
X≤45 | X < 45.5 |
X < 45 | X < 44.5 |
X≥45 | X > 44.5 |
X > 45 | X > 45.5 |
以下分步示例演示如何使用正态分布来近似二项式分布。
示例:二项式的正态近似
假设我们想知道抛掷 100 次硬币,正面朝上的次数少于或等于 43 次的概率。
在这种情况下,我们有以下价值观:
- n (试验次数)= 100
- X (成功次数)= 43
- p (给定试验的成功概率)= 0.50
要计算硬币正面朝上少于或等于 43 次的概率,我们可以使用以下步骤:
步骤 1:验证样本量是否足够大,可以使用正态近似值。
首先,我们需要检查是否满足以下条件:
- np≥5
- n(1-p)≥5
在这种情况下,我们有:
- NP = 100*0.5 = 50
- n(1-p) = 100*(1 – 0.5) = 100*0.5 = 50
两个数字都大于 5,因此我们可以安全地使用正态近似值。
步骤 2:确定要应用的连续性校正。
参考上表,我们发现当处理 X ≤ 43 形式的概率时,我们应该添加 0.5。因此,我们会找到 P(X< 43.5)。
步骤 3:求二项式分布的均值 (μ) 和标准差 (σ)。
µ = n*p = 100*0.5 = 50
σ = √ n*p*(1-p) = √ 100*.5*(1-.5) = √ 25 = 5
步骤 4:使用上一步中找到的平均值和标准差求出 z 分数。
z = (x – μ) / σ = (43.5 – 50) / 5 = -6.5 / 5 = -1.3。
步骤 5:找出与 z 分数相关的概率。
我们可以使用正态 CDF 计算器发现 -1.3 左侧的标准正态曲线下方的面积为0.0968 。
因此,抛掷 100 次硬币,正面朝上的次数少于或等于 43 次的概率为0.0968 。
该示例说明了以下内容:
- 我们遇到过随机变量服从二项式分布的情况。
- 我们想要找到该随机变量获得特定值的概率。
- 由于样本量(n = 100 次试验)足够大,我们能够使用正态分布来近似二项式分布。
这是如何使用正态近似来查找与二项式分布相关的概率的完整示例。