統計におけるy hatとは何ですか?
統計学では、 y hat ( ŷと書きます) という用語は、線形回帰モデルの応答変数の推定値を指します。
通常、推定回帰式は次のように書きます。
ŷ = β 0 + β 1 x
金:
- ŷ : 応答変数の推定値
- β 0 : 予測変数がゼロの場合の応答変数の平均値
- β 1 : 予測変数の 1 単位の増加に伴う応答変数の平均変化
たとえば、6 人の異なる学生の勉強時間数と最終試験の得点を示す次のデータセットがあるとします。
統計ソフトウェア ( R 、 Excel 、 Python 、または手動) を使用して、調査時間を予測変数として使用して次の回帰モデルを近似し、結果を応答変数として調べるとします。
スコア = 66.615 + 5.0769*(時間)
このモデルの回帰係数を解釈する方法は次のとおりです。
- ゼロ時間勉強した生徒の試験の平均スコアは66,615です。
- 試験のスコアは、学習時間が追加されるごとに平均5.0769ポイント増加します。
この回帰式を使用して、学習時間数に基づいて特定の生徒のスコアを推定できます。
たとえば、3 時間勉強した生徒は次のスコアを取得する必要があります。
スコア = 66.615 + 5.0769*(3) = 81.85
なぜYハットが使われるのか?
統計における「ハット」記号は、「推定」項を示すために使用されます。たとえば、 ŷは推定応答変数を示すために使用されます。
通常、線形回帰モデルを近似するときは、母集団からのデータの サンプルを使用します。これは、母集団内のすべての可能な観測値についてデータを収集するよりも便利で、時間がかからないためです。
したがって、回帰式を見つけるときは、予測変数と応答変数の間の真の関係を推定しているだけです。
これが、回帰式で y の代わりに ŷ という項を使用する理由です。