パラメータ推定

この記事では、統計におけるパラメータ推定とは何かについて説明します。したがって、統計におけるパラメーターの推定方法、さまざまな種類の推定値、およびパラメーター推定の例を理解できます。

パラメータ推定とは何ですか?

パラメータ推定は、標本から母集団パラメータの値を推定する統計的手法です。つまり、統計学では、データ サンプルを使用して計算を実行することで母集団パラメーターを近似するためにパラメーター推定が使用されます。

一般に、母集団のパラメーターは不明であり、一般に母集団が大きすぎるため、そのすべての個体を研究することはできません。したがって、母集団のサンプルが採取され、このサンプルが統計的に分析され、最終的に得られた結果が母集団全体から推定されます。したがって,統計パラメータを推定することで,母集団パラメータの値をおおよそ知ることができます。

パラメータを推定するときは、常に誤差の範囲が存在します。母集団パラメータの真の値は通常不明であるため、パラメータを推定する際には近似が行われるため、真の値と近似値との間に誤差が生じる場合があります。

パラメータ推定の種類

統計学では、次の 2種類のパラメータ推定値があります。

  • 特定のパラメータの推定: 母集団パラメータの値を特定の値に推定することが含まれます。通常、標本パラメータ値は母集団パラメータの推定値として使用されます。
  • 間隔によるパラメータの推定: 間隔による母集団パラメータの推定に基づいています。つまり、母集団パラメータを単一の値に近似するのではなく、ある範囲の値を近似するのです。

点推定は近似を単一の値に減らすため、間隔推定よりも正確です。ただし、点推定を使用して正確な値を決定するよりも、パラメーターの真の値が区間内に収まる可能性が高いため、区間推定の信頼性が高くなります。

ポイント推定

点推定には、標本データから母集団パラメータの正確な値を推定することが含まれます。つまり、点推定は、パラメータのサンプル値を基準として使用して、母集団パラメータの特定の値を提供します。

たとえば、1,000 人の母集団の平均を求めるには、点推定を行って 50 人のサンプルの平均値を計算します。したがって、標本平均の値を母集団平均の点推定値として取得できます。

したがって、推定量は、母集団パラメータの値を推定するために使用される標本統計量です。したがって、標本パラメータの値は母集団パラメータの値の推定値と見なされます。

推定間隔

区間推定には、区間を使用して母集団パラメータの値を推定することが含まれます。より正確には、区間推定には、パラメーター値が一定レベルの信頼度で収まる可能性が最も高い区間を計算することが含まれます。

たとえば、区間推定で母集団の平均の信頼区間が (3.7)、信頼水準が 95% であると結論付けた場合、これは、調査対象の母集団の平均が 3 ~ 7 の間にあり、確率が 95 であることを意味します。 %。

区間推定値を提供する区間は信頼区間と呼ばれます。したがって、信頼区間は、母集団パラメータの値が間にある値の推定値を誤差の範囲で与える区間です。つまり、信頼区間は区間推定から得られる結果です。区間推定の信頼区間を計算するには、対応する式を適用する必要があります。

パラメータの推定例

パラメータ推定の定義とさまざまなタイプのパラメータ推定が何であるかを理解したら、母集団パラメータを推定する方法の例を見てみましょう。

  • 市場調査では、ヘッドフォンの平均価格を決定したいと考えています。ただし、モデルが多すぎてすべての価格を調査することはできないため、昨年最も多くのヘッドフォンを販売した 5 つのブランドのサンプルを採取することにしました (データは以下に示されています)。時々および間隔を置いて母集団の平均価格を推定します。

25 8 14 19 12

母集団の平均を正確に推定するには、標本データの平均を計算するだけです。したがって、算術式の平均を適用します。

\overline{x}=\cfrac{25+8+14+19+12}{5}=15,6

ただし、これが最も一般的な信頼水準であるため、95% の信頼水準で区間によって推定します。したがって、区間推定を実行するには、平均の信頼区間の公式を適用する必要があります。

(7,43 \ , \ 23,77 )

推定誤差

実際には、パラメータの真の値を正確に推定することは非常に困難であり、推定値に誤差が生じることがよくあるのはこのためです。論理的には、推定誤差を最小限に抑えるように努めなければなりません。

したがって、母集団パラメータの値がわかっていれば、推定値とパラメータの真の値の差として定義される推定誤差を計算できます。

e=\widehat{\theta}-\theta

\widehat{\theta}

は推定値であり、

\theta

パラメータの実際の値です。

二乗誤差の平均である平均二乗誤差 (MSE) を計算することもできます。平均二乗誤差は推定量の分散を表すことに注意してください。

\displaystyle ECM=\cfrac{1}{n}\sum_{i=1}^n \left(\widehat{\theta}-\theta \right)^2

母集団パラメータの真の値が不明な場合 (最も一般的なケース)、推定値が正しいかどうかを確認するために仮説検定が実行されます。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です