1 つの標準偏差の信頼区間
標準偏差の信頼区間は、一定の信頼度で母標準偏差が含まれる可能性が高い値の範囲です。
このチュートリアルでは次について説明します。
- この信頼区間を作成する動機。
- この信頼区間を作成する式。
- この信頼区間を計算する方法の例。
- この信頼区間をどう解釈するか。
1 つの標準偏差の信頼区間: モチベーション
標準偏差の信頼区間を作成する理由は、母集団の標準偏差を推定する際の不確実性を把握するためです。
たとえば、フロリダの特定の種のカメの体重の標準偏差を推定したいとします。フロリダには何千頭ものカメが生息しているため、各カメを個別に訪ねて体重を測るのは非常に時間と費用がかかります。
代わりに、50 匹のカメの 単純な無作為サンプルを取得し、そのサンプル内のカメの体重の標準偏差を使用して、真の母集団標準偏差を推定することができます。
問題は、サンプルの標準偏差が母集団全体の標準偏差と正確に一致することが保証されていないことです。したがって、この不確実性を捉えるために、真の母集団標準偏差が含まれる可能性が高い値の範囲を含む信頼区間を作成できます。
1 つの標準偏差の信頼区間: 式
次の式を使用して平均の信頼区間を計算します。
信頼区間 = [√(n-1)s 2 /X 2 α/2 , √(n-1)s 2 /X 2 1-α/2 ]
金:
- n:サンプルサイズ
- s:サンプルの標準偏差
- X 2 : n-1 自由度のカイ二乗の臨界値。
標準偏差の信頼区間: 例
次の情報を含むカメのランダムなサンプルを収集するとします。
- サンプルサイズn = 27
- サンプル標準偏差s = 6.43
真の母集団標準偏差に対するさまざまな信頼区間を見つける方法は次のとおりです。
90% 信頼区間: [ √ (27-1)*6.43 2 /38.885, √ (27-1)*6.43 2 / 15.379) = [5.258, 8.361]
95% 信頼区間: [ √ (27-1)*6.43 2 /41.923, √ (27-1)*6.43 2 / 13.844) = [5.064, 8.812]
99% 信頼区間: [ √ (27-1)*6.43 2 /48.289, √ (27-1)*6.43 2 / 11.160) = [4.718, 9.814]
注:これらの信頼区間は、「標準偏差の信頼区間計算ツール」を使用して見つけることもできます。
1 つの標準偏差の信頼区間: 解釈
信頼区間を解釈する方法は次のとおりです。
[5.064, 8.812] の信頼区間に真の母標準偏差が含まれる確率は 95% です。
同じことを別の言い方で言えば、母集団の真の標準偏差が 95% 信頼区間の外にある可能性は 5% しかないということです。つまり、母集団の真の標準偏差が 8,812 を超えるか、5,064 未満になる確率は 5% のみです。