信頼区間とは何ですか?
統計では、母集団パラメータ、つまり母集団全体の特定の特徴を表す数値の測定に関心が集まることがよくあります。
最も一般的な母集団パラメータは次の 2 つです。
1. 母集団平均:母集団内の変数の平均値 (たとえば、米国の男性の平均身長)
2. 人口比率:人口における変数の比率 (たとえば、特定の法律を支持する郡の住民の比率)
これらのパラメータを測定したい場合でも、母集団パラメータを計算するために母集団内の各個人のデータを収集するのは一般にコストと時間がかかりすぎます。
代わりに、通常は母集団全体から無作為に標本を抽出し、その標本データを使用して母集団パラメータを推定します。
たとえば、フロリダの特定の種のカメの平均体重を推定したいとします。フロリダには何千頭ものカメが生息しているため、各カメを個別に訪ねて体重を測るのは非常に時間と費用がかかります。
代わりに、50 匹のカメの 単純な無作為サンプルを取得し、そのサンプル内のカメの平均体重を使用して、真の母集団平均を推定することができます。
問題は、サンプル内のカメの平均体重が、母集団全体のカメの平均体重と正確に一致することが保証されていないことです。たとえば、体重の軽いカメがいっぱいのサンプルを選択したり、重いカメがいっぱい入ったサンプルを選択したりする場合があります。
この不確実性を捉えるために、信頼区間を作成することができます。信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。次の一般式に従って計算されます。
信頼区間= (点推定値) +/- (臨界値)* (標準誤差)
この式は、下限と上限を持つ区間を作成します。これには、一定レベルの信頼度を持つ母集団パラメータが含まれる可能性があります。
信頼区間= [下限、上限]
たとえば、母集団平均の信頼区間を計算する式は次のとおりです。
信頼区間 = x +/- z*(s/√ n )
金:
- x :サンプル平均
- z:選択された Z 値
- s:サンプルの標準偏差
- n:サンプルサイズ
使用する Z 値は、選択した信頼レベルによって異なります。次の表は、最も一般的な信頼水準の選択肢に対応する Z 値を示しています。
自信のレベル | Z値 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
たとえば、次の情報を含むカメのランダムなサンプルを収集するとします。
- サンプルサイズn = 25
- 平均サンプル重量x = 300
- サンプル標準偏差s = 18.5
真の母集団平均体重の 90% 信頼区間を計算する方法は次のとおりです。
90% 信頼区間: 300 +/- 1.645*(18.5/√25) = [293.91, 306.09]
この信頼区間は次のように解釈されます。
[293.91, 306.09] の信頼区間にカメ個体群の真の平均体重が含まれる確率は 90% です。
同じことを別の言い方で言えば、母集団の真の平均値が 90% 信頼区間の外にある可能性は 10% しかないということです。つまり、カメ個体群の実際の平均体重が 306.09 ポンドより大きいか、293.91 ポンドより小さい可能性は 10% しかありません。
信頼区間のサイズに影響を与える可能性のある 2 つの数値があることには何の価値もありません。
1. サンプルサイズ:サンプルサイズが大きいほど、信頼区間は狭くなります。
2. 信頼水準:信頼水準が高くなるほど、信頼区間は広くなります。
信頼区間の種類
信頼区間には多くの種類があります。最も一般的に使用されるものは次のとおりです。
平均値の信頼区間
平均値の信頼区間は、一定の信頼レベルで母集団平均が含まれる可能性が高い値の範囲です。この間隔を計算する式は次のとおりです。
信頼区間 = x +/- z*(s/√ n )
金:
- x :サンプルの平均値
- z:選択された Z 値
- s:サンプルの標準偏差
- n:サンプルサイズ
リソース:
平均値の信頼区間を計算する方法
平均計算ツールの信頼区間
平均間の差の信頼区間
平均値間の差の信頼区間 (CI) は、一定の信頼レベルで 2 つの母集団平均間の真の差が含まれる可能性が高い値の範囲です。この間隔を計算する式は次のとおりです。
信頼区間= ( x 1 – x 2 ) +/- t*√((s p 2 /n 1 ) + (s p 2 /n 2 ))
金:
- x 1 、 x 2 : サンプル 1 の平均、サンプル 2 の平均
- t: 信頼水準と (n 1 + n 2 -2) 自由度に基づく t 臨界値
- s p 2 : プールされた分散
- n 1 、n 2 : サンプルサイズ 1、サンプルサイズ 2
金:
- プールされた分散は次のように計算されます。 s p 2 = ((n 1 -1)s 1 2 + (n 2 -1)s 2 2 ) / (n 1 +n 2 -2)
- t 臨界値t は、逆 t 分布計算ツールを使用して見つけることができます。
リソース:
平均値間の差の信頼区間を計算する方法
平均値間の差の信頼区間計算ツール
割合の信頼区間
割合の信頼区間は、一定の信頼レベルで母集団の割合が含まれる可能性が高い値の範囲です。この間隔を計算する式は次のとおりです。
信頼区間 = p +/- z*(√ p(1-p) / n )
金:
- p:サンプル割合
- z:選択された Z 値
- n:サンプルサイズ
比率の差の信頼区間
比率の差の信頼区間は、一定の信頼度で 2 つの母集団比率間の真の差が含まれる可能性が高い値の範囲です。この間隔を計算する式は次のとおりです。
信頼区間 = (p 1 –p 2 ) +/- z*√(p 1 (1-p 1 )/n 1 + p 2 (1-p 2 )/n 2 )
金:
- p 1 、p 2 : サンプル 1 の割合、サンプル 2 の割合
- z: 信頼水準に基づく z 臨界値
- n 1 、n 2 : サンプルサイズ 1、サンプルサイズ 2