適切な信頼区間とは何ですか?
信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。
学生からよく聞かれる質問は次のとおりです。
適切な信頼区間とはどれくらいだと考えられますか?
答え: 一般に、信頼区間は狭い方が望ましいです。これは、特定の母集団パラメータが確実に含まれる狭い範囲の値が得られるためです。
たとえば、特定の植物種の平均高さを推定し、次の 95% 信頼区間を作成するとします。
95% 信頼区間 = [12.5 インチ、60.5 インチ]
これを次の 95% 信頼区間と比較してください。
95% 信頼区間 = [34 インチ, 39 インチ]
2 番目の信頼区間ははるかに狭く、真の平均母集団サイズがどのくらいであるかをより正確に知ることができます。
ただし、狭い信頼区間を取得するにはサンプルサイズを増やす必要がありますが、実際の研究では必ずしも現実的ではありません。
これを説明するために、次の例を考えてみましょう。
例: 信頼区間の計算
母集団平均の信頼区間を計算するには、次の式を使用できます。
信頼区間 = x ± z*(s/√ n )
金:
- x :サンプルの平均値
- z:選択された Z 値
- s:サンプルの標準偏差
- n:サンプルサイズ
使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。
| 自信のレベル | Z値 |
|---|---|
| 0.90 | 1,645 |
| 0.95 | 1.96 |
| 0.99 | 2.58 |
たとえば、次の情報を含む 25 個の植物のランダム サンプルを収集するとします。
- サンプルサイズn = 25
- 平均サンプル高さx = 36.5 インチ
- サンプル標準偏差s = 18.5 インチ
真の平均母集団サイズの 95% 信頼区間を計算する方法は次のとおりです。
95% 信頼区間: 36.5 ± 1.96*(18.5/√ 25 ) = [29.248, 43.752]
この間隔は、この植物種の個体群の真の平均高さが 29.248 インチから 43.752 インチの間にあることを 95% 確信していることを意味すると解釈します。
ここで、次の情報を含む 100 個の植物からなるランダムなサンプルを収集するとします。
- サンプルサイズn = 100
- 平均サンプル高さx = 36.5 インチ
- サンプル標準偏差s = 18.5 インチ
真の平均母集団サイズの 95% 信頼区間を計算する方法は次のとおりです。
95% 信頼区間: 36.5 ± 1.96*(18.5/√ 100 ) = [32.874, 40.126]
この間隔は、この植物種の個体群の真の平均高さが 32.874 インチから 40.126 インチの間にあることを 95% 確信していることを意味すると解釈します。
単純にサンプルサイズを増やすことで、母集団平均の信頼区間を狭くすることができたことに注意してください。
実際の状況では、研究者はこの 2 番目の間隔を好むでしょう。これにより、真の母集団平均値に含まれる可能性のある値の範囲をより正確に把握できるからです。
ただし、多くの場合、より大きなサンプルサイズを収集するには時間とリソースが大量に消費されるため、実際にはそうすることが常に現実的であるとは限りません。
また、一部のデータセットではデータのばらつきが大きく、サンプル標準偏差の値が高くなることにも注意してください。これにより、当然、信頼区間が広くなります。
したがって、「狭い」信頼区間を作成するために、研究者が実際に制御できる唯一の変数はサンプルサイズです。
結論
この記事で取り上げる主なポイントを簡単にまとめます。
1.研究者は多くの場合、「良好な」信頼区間は狭い区間であると考えます。
2.使用するサンプルサイズを増やすことにより、研究者はより狭い信頼区間を生成できます。
3.一部の種類のデータは他の種類よりも高い変動性を自然に示すため、何が「狭い」信頼区間とみなされるかは分野ごとに異なります。
追加リソース
次のチュートリアルでは、信頼区間に関する追加情報を提供します。