平均値の信頼区間
平均値の信頼区間は、一定の信頼レベルで母集団平均が含まれる可能性が高い値の範囲です。
このチュートリアルでは次について説明します。
- 平均の信頼区間を作成する動機。
- 平均値の信頼区間を作成するための式。
- 平均値の信頼区間を計算する方法の例。
- 平均値の信頼区間を解釈する方法。
平均の信頼区間: モチベーション
平均値に対して信頼区間を作成する理由は、母集団の平均値を推定する際の不確実性を把握したいためです。
たとえば、フロリダの特定の種のカメの平均体重を推定したいとします。フロリダには何千頭ものカメが生息しているため、各カメを個別に訪ねて体重を測るのは非常に時間と費用がかかります。
代わりに、50 匹のカメの 単純な無作為サンプルを取得し、そのサンプル内のカメの平均体重を使用して、真の母集団平均を推定することができます。
問題は、サンプルの平均体重が母集団全体の平均体重と正確に一致することが保証されていないことです。したがって、この不確実性を捉えるために、個体群内のカメの真の平均体重が含まれる可能性が高い値の範囲を含む信頼区間を作成できます。
平均値の信頼区間: 式
次の式を使用して平均の信頼区間を計算します。
信頼区間 = x +/- z*(s/√ n )
金:
- x :サンプルの平均値
- z:選択された Z 値
- s:サンプルの標準偏差
- n:サンプルサイズ
使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。
自信のレベル | Z値 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
より高い信頼水準はより大きな Z 値に対応し、より広い信頼区間につながることに注意してください。これは、たとえば、同じデータセットでは 99% 信頼区間が 95% 信頼区間よりも広いことを意味します。
平均値の信頼区間: 例
次の情報を含むカメのランダムなサンプルを収集するとします。
- サンプルサイズn = 25
- 平均サンプル重量x = 300
- サンプル標準偏差s = 18.5
母集団の真の平均体重に対するさまざまな信頼区間を見つける方法は次のとおりです。
90% 信頼区間: 300 +/- 1.645*(18.5/√ 25 ) = [293.91, 306.09]
95% 信頼区間: 300 +/- 1.96*(18.5/√ 25 ) = [292.75, 307.25]
99% 信頼区間: 300 +/- 2.58*(18.5/√ 25 ) = [ 290.47 , 309.53]
注:これらの信頼区間は、「統計的信頼区間計算ツール」を使用して見つけることもできます。
平均値の信頼区間: 解釈
信頼区間を解釈する方法は次のとおりです。
[292.75, 307.25] の信頼区間にカメ個体群の真の平均体重が含まれる確率は 95% です。
同じことを別の言い方で言えば、母集団の真の平均値が 95% 信頼区間の外にある可能性は 5% しかないということです。つまり、カメ個体群の実際の平均体重が 307.25 ポンドを超えるか、292.75 ポンド未満になる可能性は 5% しかありません。