信頼水準と信頼区間: 違いは何ですか?
統計では、母集団パラメータ、つまり 母集団全体の特定の特性を表す数値を測定しようとすることがよくあります。
たとえば、特定の国の男性の平均身長を測定することに興味があるかもしれません。
国内の男性全員の身長に関するデータを収集するには費用と時間がかかりすぎるため、代わりに男性の 単純な無作為サンプルに関するデータを収集します。次に、このサンプルの男性の平均身長を使用して、国内の全男性の平均身長を推定します。
残念ながら、サンプル内の男性の平均身長が母集団全体の男性の平均身長と正確に一致するという保証はありません。たとえば、背の低い男性のサンプルを選択したり、背の高い男性のサンプルを選択したりする場合があります。
母集団の真の平均値の推定値に関する不確実性を把握するために、信頼区間を作成できます。
信頼区間:一定レベルの信頼度を持つ母集団パラメータが含まれる可能性が高い値の範囲。
信頼区間は、次の一般式を使用して計算されます。
信頼区間= (点推定値) +/- (臨界値)* (標準誤差)
たとえば、 母集団平均の信頼区間を計算する式は次のとおりです。
信頼区間 = x +/- z*(s/√ n )
金:
- x :サンプル平均
- z: zの臨界値
- s:サンプルの標準偏差
- n:サンプルサイズ
式で使用する臨界 Z 値は、選択した信頼レベルによって異なります。
信頼水準:真の母集団パラメータを含むと予想されるすべての可能なサンプルの割合。
信頼レベルの最も一般的な選択肢は 90%、95%、および 99% です。
次の表は、これらの一般的な信頼レベルの選択肢に対応する重要な Z 値を示しています。
自信のレベル | z臨界値 |
---|---|
0.90 | 1,645 |
0.95 | 1.96 |
0.99 | 2.58 |
たとえば、25 人の男性の身長を測定し、次のことが判明したとします。
- サンプルサイズn = 25
- 平均サンプル高さx = 70 インチ
- サンプル標準偏差s = 1.2 インチ
90% の信頼水準を使用して、真の平均母集団サイズの信頼区間を計算する方法は次のとおりです。
90% 信頼区間: 70 +/- 1.645*(1.2/√25) = [69.6052, 70.3948]
これは、同じサンプリング方法を使用して異なるサンプルを選択し、各サンプルの信頼区間を計算した場合、真の平均母集団サイズは 90% の確率で区間内に収まると期待されることを意味します。
ここで、代わりに95% の信頼水準を使用して信頼区間を計算するとします。
95% 信頼区間: 70 +/- 1.96*(1.2/√25) = [69.5296, 70.4704]
この信頼区間は前のものよりも広いことに注意してください。実際、信頼水準が高くなるほど、信頼区間は広くなります。
信頼水準が高いほど、信頼区間は広くなります。
これは直感的に理解できるはずです。信頼水準が広いほど、真の母集団パラメータが含まれる可能性が高くなります。
まとめ
要約すれば:
信頼区間は、一定の信頼レベルで母集団パラメータが含まれる可能性が高い値の範囲です。次の基本的な公式を使用します。
信頼区間 = (点推定値) +/- (臨界値)* (標準誤差)
信頼水準によって、この式で使用する臨界値が決まります。信頼水準が高くなるほど臨界値も大きくなるため、信頼区間も広くなります。