推定間隔
この記事では、統計における区間推定とは何かについて説明します。また、間隔推定がどのように実行されるか、そして最後に、間隔推定が点推定とどのように異なるのかについても学習します。
間隔推定とは何ですか?
統計学における区間推定は、区間を使用して母集団パラメータの値を推定するプロセスです。より正確には、区間推定には、パラメーター値が特定のレベルの信頼度で見つかる可能性が最も高い区間を計算することが含まれます。
たとえば、区間推定で母集団の平均の信頼区間が (3.7)、信頼水準が 95% であるという結論に達した場合、これは、調査対象の母集団の平均が 3 ~ 7 の間にあることを意味します。確率は95%。
一般に、母集団のサイズはそのすべての個体を研究するには大きすぎるため、その統計的測定値は確実に知ることができず、むしろ近似値になります。
したがって、間隔推定は、サンプルデータに基づいて、母集団パラメータがその間にある値の範囲の近似値を提供するために使用されます。このようにして、サンプルから調査されたデータから母集団パラメータの値を推定できます。
最後に、区間推定の意味を完全に理解するには、信頼区間の概念を理解する必要があります。信頼区間は、誤差の範囲内で、母集団パラメータの値が間にある値の近似値を提供する区間です。したがって、信頼区間は区間推定から得られる結果です。
間隔推定式
以下に、信頼区間を推定するためのさまざまな式を示します。これは、信頼区間を平均、分散、または割合のいずれについて推定するかによって、使用する式が異なるためです。
平均値の信頼区間
変数を入力するプロセスが次のようになると仮定します。
平均値の信頼区間は、Z α/2の値に標準偏差 (σ) を掛け、サンプルのサイズ (n) の平方根で割った値をサンプル平均に加算および減算することによって計算されます。したがって、平均の信頼区間を計算する式は次のようになります。
大きなサンプル サイズと 95% の信頼水準の場合、臨界値は Z α/2 = 1.96 で、99% の信頼水準の場合、臨界値は Z α/2 = 2.576 です。
上記の式は、母集団の分散がわかっている場合に使用されます。ただし、母集団の分散が不明な場合 (最も一般的なケース)、平均の信頼区間は次の式を使用して計算されます。
金:
-
はサンプル平均です。
-
は、確率 α/2 の n-1 自由度のスチューデント t 分布の値です。
-
は標本標準偏差です。
-
はサンプルサイズです。
分散の信頼区間
母集団の分散の信頼区間を計算するには、カイ二乗分布が使用されます。より具体的には、分散の信頼区間を計算する式は次のとおりです。
金:
-
はサンプルサイズです。
-
は標本標準偏差です。
-
α/2 未満の確率に対する n-1 自由度のカイ二乗分布の値です。
-
は、1-α/2 より大きい確率に対する n-1 自由度のカイ二乗分布の値です。
割合の信頼区間
比率の信頼区間は、Z α/2の値にサンプル比率 (p) の平方根を掛け、1-p を掛けてサンプル サイズ (n) で割った値をサンプル比率に加算および減算することによって計算されます。したがって、比率の信頼区間を計算する式は次のとおりです。
金:
-
はサンプルの割合です。
-
はサンプルサイズです。
-
α/2 の確率に対応する標準正規分布の分位数です。サンプルサイズが大きく、95% の信頼水準の場合は通常 1.96 に近く、99% の信頼水準の場合は通常 2.576 に近くなります。
区間推定と点推定
最後に、区間推定と点推定の違いについて説明します。母集団パラメータの値は、(この記事全体で見たように)区間を使用して推定することも、点値を使用して推定することもできるためです。
区間推定とポイント推定の違いは、パラメータ推定で使用される値の範囲です。区間推定では、パラメーターは信頼区間に近似されますが、点推定では、パラメーターは特定の値に近似されます。
したがって、点推定では、標本データから計算された単一の値が母集団パラメータ値の近似値と見なされます。たとえば、母集団の平均はサンプル平均を使用して正確に推定できます。
したがって、点推定には区間推定に比べて長所と短所があり、各タイプの推定は特定の状況での使用に適しています。詳細については、次のリンクをクリックしてください。