人口比率とは何ですか?
統計において、母集団の割合とは、 母集団内の特定の特徴を持つ個人の割合を指します。
たとえば、ある都市の住民の 43.8% が新しい法律を支持しているとします。値0.438は人口比率を表します。
人口比率の計算式
母集団の割合は常に 0 ~ 1 (またはパーセンテージとして 0% ~ 100%) の間であり、次のように計算されます。
p = X / N
金:
- p:人口に占める割合
- X:集団内の特定の特性を持つ個人の数。
- N:集団内の個体の総数。
人口比率を推定する方法
一般に、母集団内の各個人のデータを収集するには時間とコストがかかりすぎるため、サンプルのデータを収集することがよくあります。
たとえば、特定の都市の住民の何パーセントが新しい法律を支持しているかを知りたいとします。人口が合計 50,000 人の住民で構成されている場合、1,000 人の住民から 単純な無作為サンプルを取得できます。
次に、サンプルの割合を次のように計算します。
p̂ = x / n
金:
- p̂:サンプルの割合
- x:サンプル内で特定の特徴を持つ個体の数。
- n:サンプル内の個体の総数。
次に、このサンプル比率を使用して母集団比率を推定します。たとえば、サンプルの住民 1,000 人のうち 367 人が新しい法律を支持した場合、サンプルの割合は次のように計算されます: 367/1,000 = 0.367 。
したがって、人口に占めるこの法律を支持する住民の割合の最良の推定値は0.367 になります。
母集団の割合の信頼区間
サンプルの割合から真の母集団の割合の推定値は得られますが、サンプルの割合が母集団の割合と正確に一致するという保証はありません。
このため、一般に信頼区間、つまり高い信頼度で母集団の真の割合を含む可能性が高い値の範囲を構築します。
母集団比率の信頼区間を計算する式は次のとおりです。
信頼区間 = p̂ +/- z*√ p̂(1-p̂) / n
金:
- p̂:サンプルの割合
- z:選択された Z 値
- n:サンプルサイズ
使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。
自信のレベル | Z値 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
より高い信頼水準はより大きな Z 値に対応し、より広い信頼区間につながることに注意してください。これは、たとえば、同じデータセットでは 95% 信頼区間が 90% 信頼区間よりも広いことを意味します。
例: 母集団の割合の信頼区間
特定の法律を支持する都市の住民の割合を推定したいとします。私たちは住民 100 人のサンプルを無作為に選び、法律に対する彼らの立場を尋ねました。結果は次のとおりです。
- サンプルサイズn = 100
- 法律を支持する割合p̂ = 0.56
母比率のさまざまな信頼区間を見つける方法は次のとおりです。
90% 信頼区間: 0.56 +/- 1.645*(√ 0.56(1-0.56) / 100 ) = [0.478, 0.642]
95% 信頼区間: 0.56 +/- 1.96*(√ 0.56(1-0.56) / 100 ) = [0.463, 0.657]
99% 信頼区間: 0.56 +/- 2.58*(√ 0.56(1-0.56) / 100 ) = [0.432, 0.688]
注:これらの信頼区間は、「比率の信頼区間計算ツール」を使用して見つけることもできます。