統計における合否条件とは何ですか?
ベルヌーイ試行は、「成功」または「失敗」の 2 つの結果しか考えられない実験であり、実験が実行されるたびに成功の確率は同じです。
ベルヌーイのエッセイの例としては、コイントスがあります。コインは 2 つの表にのみ着地できます (表を「ヒット」、裏を「失敗」と呼びます)。コインが公正であると仮定すると、各フリップでの成功確率は 0.5 です。
統計では、複数のベルヌーイ試行を含む確率を計算する場合、正規分布を近似値として使用することがよくあります。ただし、これを行うには、合格/不合格条件が満たされていることを確認する必要があります。
合否条件:正規分布を近似値として使用するには、サンプル内に少なくとも 10 回の成功と予想される失敗が 10 回存在する必要があります。
記法で書くと、次の 2 つのことを確認する必要があります。
- 期待される成功数は少なくとも 10 です: np ≥ 10
- 予想される失敗数は少なくとも 10 です: n(1-p) ≥ 10
ここで、 nはサンプル サイズ、 pは特定の試行の成功確率です。
注:一部のマニュアルでは、正規近似を使用するために必要なのは、期待される成功が 5 回、失敗が 5 回だけであると記載されています。ただし、10 の方が一般的に使用され、より控えめな数値です。したがって、このチュートリアルではこの番号を使用します。
例: 合否条件の確認
特定の法律を支持する郡の住民の割合の信頼区間を作成したいとします。私たちは住民 100 人のサンプルを無作為に選び、法律に対する彼らの立場を尋ねました。結果は次のとおりです。
- サンプルサイズn = 100
- 法律を支持する割合p = 0.56
次の式を使用して信頼区間を計算したいと思います。
信頼区間 = p +/- z*√ p(1-p) / n
金:
- p:サンプル割合
- z:正規分布に対応する z 値
- n:サンプルサイズ
この式では、正規分布の Z 値が使用されます。したがって、この式では正規分布を使用して二項分布を近似します。
ただし、これを行うには、合否条件が満たされていることを確認する必要があります。サンプル内の成功数と失敗数が少なくとも 10 であることを確認してみましょう。
成功数: np = 100*.56 = 56
失敗数: n(1-p) = 100*(1-.56) = 44
どちらの数値も 10 以上であるため、上記の式を使用して信頼区間を計算できます。
追加リソース
二項分布の近似として正規分布を使用するために満たさなければならないもう 1 つの条件は、対象とするサンプル サイズが母集団サイズの 10% を超えないことです。これを10%条件といいます。
また、2 つの比率を使用する場合 (たとえば、 比率の差の信頼区間を作成する場合)、 2 つのサンプルで期待される成功数と失敗数が少なくとも 10 であることを確認する必要があることにも注意してください。