統計における点推定とは何ですか?
統計では、母集団パラメータ、つまり母集団全体の特定の特徴を表す数値の測定に関心が集まることがよくあります。
最も一般的な母集団パラメータは次の 2 つです。
1. 人口平均:人口内の変数の平均値 (たとえば、特定の都市の男性の平均身長)
2. 人口比率:人口における変数の比率 (たとえば、特定の法律を支持する郡の住民の比率)
これらのパラメータを測定したい場合でも、集団内のすべての個人のデータを収集するには一般に費用と時間がかかりすぎます。
代わりに、母集団から無作為に サンプルを抽出し、そのサンプルデータを使用して母集団パラメータを推定します。
母集団パラメータを推定するために標本で使用する数値は、点推定 と呼ばれます。これは、実際の母集団パラメータについて考えられる最良の推定値です。
次の表は、母集団パラメータの推定に使用する点推定値を示しています。
対策 | 母集団パラメータ | ポイント推定 |
---|---|---|
平均 | μ (母平均) | x (サンプル平均) |
割合 | π (人口の割合) | p (サンプル割合) |
母集団パラメータを計算したいのですが、時間とコストがかかりすぎるため、代わりにサンプルを使用して点推定値を計算します。
たとえば、フロリダの特定の種のカメの平均体重を推定したいとします。フロリダには何千頭ものカメが生息しているため、各カメを個別に訪ねて体重を測るのは非常に時間と費用がかかります。代わりに、50 匹のカメの 単純な無作為サンプルを取得し、そのサンプル内のカメの平均体重を使用して、母集団の真の平均値を推定することができます。
サンプル平均が 150.4 ポンドの場合、種全体の真の母集団平均の点推定値は 150.4 ポンドになります。
代表的なサンプルの重要性
母集団からサンプルを収集するとき、理想的には、そのサンプルが母集団の「ミニバージョン」に似ていることが望ましいと考えられます。
サンプル内の個人の特徴が母集団全体の個人の特徴とよく一致する場合、サンプルは母集団を代表していると言われます。
これが起こると、標本からの結果を母集団全体に自信を持って一般化することができ、標本点推定値は真の母集団パラメータの不偏推定値であると言えます。
点推定値と信頼区間
点推定値は、真の母集団パラメータの可能な限り最良の推定値を表しますが、母集団パラメータと正確に一致する可能性は低いです。
前の例では、サンプル内のカメの平均体重が母集団全体のカメの平均体重と正確に一致するという保証はありません。たとえば、体重の軽いカメがいっぱいのサンプルを選択したり、重いカメがいっぱい入ったサンプルを選択したりする場合があります。
したがって、この不確実性を捉えるために、信頼区間、つまり一定の信頼レベルを持つ母集団パラメータが含まれる可能性が高い値の範囲を作成できます。
たとえば、サンプル平均 150.4 ポンドを使用して、カメの種の真の平均体重を推定できます。信頼区間は、おそらく 145 ポンドから 155.8 ポンドの範囲の値になります。
私たちの点推定は、真の平均母集団体重の最良の推定値であり、信頼区間は、真の母集団体重の真の平均を含む可能性のある値の範囲を提供します。
信頼区間について詳しくは、こちらをご覧ください。