正規二項近似: 定義と例
- μ = np
- σ = √ np(1-p)
nが十分に大きい場合、正規分布を使用して二項分布に関連する確率を近似できることがわかります。これは、正規二項近似と呼ばれます。
nが「十分に大きい」ためには、次の基準を満たしている必要があります。
- np ≧ 5
- n(1-p) ≥ 5
両方の基準が満たされる場合、正規分布を使用して、二項分布に関連する確率の質問に答えることができます。
ただし、正規分布は連続確率分布であるのに対し、二項分布は離散確率分布であるため、確率を計算する際には連続性補正を適用する必要があります。
簡単に言うと、連続性補正とは、離散 x 値に 0.5 を加算または減算することを指します。
たとえば、コインを 100 回投げる間に、コインが 45 回以下で表になる確率を求めたいとします。つまり、P(X ≤ 45) を見つけたいのです。正規分布を使用して二項分布を近似するには、代わりに P(X ≤ 45.5) を見つけます。
次の表は、検索しようとしている確率のタイプに応じて、いつ 0.5 を加算または減算する必要があるかを示しています。
二項分布を使用する | 連続性補正を伴う正規分布の使用 |
---|---|
X = 45 | 44.5 < X < 45.5 |
X ≤ 45 | X < 45.5 |
X < 45 | X < 44.5 |
X ≥ 45 | X > 44.5 |
X > 45 | X > 45.5 |
次の段階的な例は、正規分布を使用して二項分布を近似する方法を示しています。
例: 二項式の正規近似
コインを 100 回投げて 43 回以下で表が出る確率を知りたいとします。
この状況では、次の値があります。
- n (試行回数) = 100
- X (成功数) = 43
- p (特定の試行での成功確率) = 0.50
コインが表になる確率が 43 回以下になる確率を計算するには、次の手順を使用します。
ステップ 1: サンプル サイズが正規近似を使用するのに十分な大きさであることを確認します。
まず最初に、次の基準が満たされていることを確認する必要があります。
- np ≧ 5
- n(1-p) ≥ 5
この場合、次のようになります。
- np = 100*0.5 = 50
- n(1-p) = 100*(1 – 0.5) = 100*0.5 = 50
どちらの数値も 5 より大きいため、正規の近似を安全に使用できます。
ステップ 2: 適用する連続性補正を決定します。
上の表を参照すると、X ≤ 43 の形式で確率を扱う場合は 0.5 を追加する必要があることがわかります。したがって、P(X< 43.5) が見つかります。
ステップ 3: 二項分布の平均 (μ) と標準偏差 (σ) を求めます。
μ = n*p = 100*0.5 = 50
σ = √ n*p*(1-p) = √ 100*.5*(1-.5) = √ 25 = 5
ステップ 4: 前のステップで見つかった平均と標準偏差を使用して Z スコアを見つけます。
z = (x – μ) / σ = (43.5 – 50) / 5 = -6.5 / 5 = -1.3。
ステップ 5: Z スコアに関連付けられた確率を見つけます。
正規 CDF 計算ツールを使用すると、-1.3 の左側の標準正規曲線の下の面積が0.0968であることがわかります。
したがって、コインを 100 回投げて表が 43 回以下になる確率は0.0968です。
この例は次のことを示しています。
- 確率変数が二項分布に従う状況がありました。
- この確率変数に対して特定の値が得られる確率を見つけたいと考えました。
- サンプル サイズ (n = 100 試行) が十分に大きかったため、正規分布を使用して二項分布を近似することができました。
これは、正規近似を使用して二項分布に関連する確率を見つける方法の完全な例です。