サンプルサイズと誤差範囲の関係
統計では、母集団の割合や母集団の平均など、母集団パラメータの値を推定したいことがよくあります。
これらの値を推定するには、通常、 単純な無作為サンプルを収集し、サンプル比率またはサンプル平均を計算します。
次に、これらの推定値に関する不確実性を把握するために信頼区間を構築します。
次の式を使用して、母集団の割合の信頼区間を計算します。
信頼区間 = p ± z*√ p(1-p) / n
金:
- p:サンプル割合
- z:選択された Z 値
- n:サンプルサイズ
そして、次の式を使用して母集団平均の信頼区間を計算します。
信頼区間 = x̄ ± z*(s/√ n )
金:
- x̄:サンプル平均
- z:選択された Z 値
- s : サンプル標準偏差
- n:サンプルサイズ
どちらの式でも、サンプルサイズと誤差範囲の間には反比例の関係があります。
サンプルサイズが大きいほど、誤差の範囲は小さくなります。逆に、サンプルサイズが小さいほど、誤差の範囲は大きくなります。
これをよりよく理解するには、次の 2 つの例を確認してください。
例 1: 母集団比率のサンプル サイズと誤差の範囲
次の式を使用して、母集団の割合の信頼区間を計算します。
信頼区間 = p ± z*√ p(1-p) / n
赤色の部分は誤差範囲と呼ばれます。
信頼区間 = p ± z*√ p(1-p) / n
誤差の範囲内で、n (サンプルサイズ) で割ることに注意してください。
したがって、サンプルサイズが大きい場合は、大きな数で割ることにより、誤差の合計が減少します。これにより、信頼区間が狭くなります。
たとえば、次の情報を含むデータの単純なランダム サンプルを収集するとします。
- p: 0.6
- n: 25
母集団の割合の 95% 信頼区間を計算する方法は次のとおりです。
- 信頼区間 = p ± z*√ p(1-p) / n
- 信頼区間 = 0.6 ± 1.96*√ 0.6(1-0.6) / 25
- 信頼区間 = 0.6 ± 0.192
- 信頼区間 = [.408, .792]
ここで、代わりにサンプル サイズ 200 を使用した場合を考えてみましょう。母集団の割合の 95% 信頼区間を計算する方法は次のとおりです。
- 信頼区間 = p ± z*√ p(1-p) / n
- 信頼区間 = 0.6 ± 1.96*√ 0.6(1-0.6) / 200
- 信頼区間 = 0.6 ± 0.068
- 信頼区間 = [.532, .668]
サンプルサイズを増やすだけで、誤差の範囲が減り、より狭い信頼区間が得られることに注意してください。
例 2: 母集団平均のサンプル サイズと誤差の範囲
次の式を使用して母集団平均の信頼区間を計算します。
信頼区間 = x̄ ± z*(s/√ n )
赤色の部分は誤差範囲と呼ばれます。
信頼区間 = x̄ ± z*(s/√ n )
誤差の範囲内で、n (サンプルサイズ) で割ることに注意してください。
したがって、サンプルサイズが大きい場合は、大きな数で割ることにより、誤差の合計が減少します。これにより、信頼区間が狭くなります。
たとえば、次の情報を含むデータの単純なランダム サンプルを収集するとします。
- x̄: 15
- 秒:4
- n: 25
母平均の 95% 信頼区間を計算する方法は次のとおりです。
- 信頼区間 = x̄ ± z*(s/√ n )
- 信頼区間 = 15 ± 1.96*(4/√ 25 )
- 信頼区間 = 15 ± 1.568
- 信頼区間 = [13.432, 16.568]
ここで、代わりにサンプル サイズ 200 を使用した場合を考えてみましょう。母集団平均の 95% 信頼区間を計算する方法は次のとおりです。
- 信頼区間 = x̄ ± z*(s/√ n )
- 信頼区間 = 15 ± 1.96*(4/√ 200 )
- 信頼区間 = 15 ± 0.554
- 信頼区間 = [14.446, 15.554]
単純にサンプルサイズを増やすことで、誤差の範囲を減らし、より狭い信頼区間を生成できることに注意してください。
追加リソース
次のチュートリアルでは、割合の信頼区間に関する追加情報を提供します。
次のチュートリアルでは、平均値の信頼区間に関する追加情報を提供します。