統計におけるy hatとは何ですか?


統計学では、 y hat ( ŷと書きます) という用語は、線形回帰モデルの応答変数の推定値を指します。

通常、推定回帰式は次のように書きます。

ŷ = β 0 + β 1 x

金:

  • ŷ : 応答変数の推定値
  • β 0 : 予測変数がゼロの場合の応答変数の平均値
  • β 1 : 予測変数の 1 単位の増加に伴う応答変数の平均変化

たとえば、6 人の異なる学生の勉強時間数と最終試験の得点を示す次のデータセットがあるとします。

統計ソフトウェア ( RExcelPython 、または手動) を使用して、調査時間を予測変数として使用して次の回帰モデルを近似し、結果を応答変数として調べるとします

スコア = 66.615 + 5.0769*(時間)

このモデルの回帰係数を解釈する方法は次のとおりです。

  • ゼロ時間勉強した生徒の試験の平均スコアは66,615です。
  • 試験のスコアは、学習時間が追加されるごとに平均5.0769ポイント増加します。

この回帰式を使用して、学習時間数に基づいて特定の生徒のスコアを推定できます。

たとえば、3 時間勉強した生徒は次のスコアを取得する必要があります。

スコア = 66.615 + 5.0769*(3) = 81.85

なぜYハットが使われるのか?

統計における「ハット」記号は、「推定」項を示すために使用されます。たとえば、 ŷは推定応答変数を示すために使用されます。

通常、線形回帰モデルを近似するときは、母集団からのデータの サンプルを使用します。これは、母集団内のすべての可能な観測値についてデータを収集するよりも便利で、時間がかからないためです。

したがって、回帰式を見つけるときは、予測変数と応答変数の間の真の関係を推定しているだけです。

これが、回帰式で y の代わりに ŷ という項を使用する理由です。

追加リソース

単線形回帰の概要
重線形回帰の概要
説明変数と応答変数の概要

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です