比率の標準誤差: 計算式と例
統計では、 集団内の特定の特性を持つ個人の割合を推定しようとすることがよくあります。
たとえば、新しい法律を支持する特定の都市の住民の割合を推定したい場合があります。
各住民に法律を支持するかどうかを尋ねる代わりに、 単純な無作為サンプルを収集し、サンプル内の何人の住民が法律を支持しているかを調べます。
次に、サンプル比率 (p̂)を次のように計算します。
比例式の例:
p̂ = x / n
金:
- x:サンプル内で特定の特徴を持つ個体の数。
- n:サンプル内の個体の総数。
次に、このサンプル比率を使用して母集団比率を推定します。たとえば、サンプルの住民 300 人のうち 47 人が新しい法律を支持した場合、サンプルの割合は次のように計算されます: 47/300 = 0.157 。
これは、人口に占めるこの法律を支持する住民の割合の最良の推定値が0.157であることを意味します。
ただし、この推定値が実際の母集団の比率と正確に一致するという保証はないため、通常は比率の標準誤差も計算します。
これは次のように計算されます。
比例式の標準誤差:
標準誤差 = √ p̂(1-p̂) / n
たとえば、p̂ = 0.157 および n = 300 の場合、比率の標準誤差は次のように計算されます。
割合の標準誤差 = √ .157(1-.157) / 300 = 0.021
次に、通常はこの標準誤差を使用して、法律を支持する住民の真の割合の信頼区間を計算します。
これは次のように計算されます。
母集団比率式の信頼区間:
信頼区間 = p̂ +/- z*√ p̂(1-p̂) / n
この式を見ると、割合の標準誤差が大きいほど、信頼区間が広くなることが簡単にわかります。
式内のz は、最も一般的な信頼水準の選択肢に対応する z 値であることに注意してください。
自信のレベル | Z値 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
たとえば、新しい法律を支持する都市住民の真の割合の 95% 信頼区間を計算する方法は次のとおりです。
- 95% CI = p̂ +/- z*√ p̂(1-p̂) / n
- 95% CI = 0.157 +/- 1.96*√ 0.157(1-0.157) / 300
- 95% CI = 0.157 +/- 1.96*(0.021)
- 95% CI = [.10884, .19816]
したがって、新しい法律を支持する都市住民の本当の割合は 10,884% から 19,816% の間であると 95% の自信を持って言えます。