R 倍数または r 平方: 違いは何ですか?


ほとんどの統計ソフトウェアを使用して回帰モデルを当てはめると、多くの場合、結果に次の 2 つの値が含まれることに気づくでしょう。

多重 R: 3 つ以上の変数間の多重相関係数。

R-2 乗:これは (Multiple R) 2として計算され、予測変数によって説明できる回帰モデルの応答変数の分散の割合を表します。この値は 0 から 1 まで変化します。

実際には、応答変数の値を予測する際に予測子変数がどれほど役立つかを示すため、R 二乗値に関心が集まることがよくあります。

ただし、新しい予測子変数をモデルに追加するたびに、その予測子変数が役に立たない場合でも、R 二乗は確実に増加します。

調整済み R 二乗は、回帰モデル内の予測子の数を調整する R 二乗の修正バージョンです。次のように計算されます。

調整済み R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)]

金:

  • R2 : モデルのR2
  • n : 観測値の数
  • k : 予測子変数の数

R 二乗はモデルに予測変数を追加すると常に増加するため、調整された R 二乗は、モデル内の予測変数の数に基づいて調整され、モデルがどれほど有用であるかを示す指標として機能します。

これらの各用語をより深く理解するために、次の例を考えてみましょう。

例: 複数の R、R 二乗、および調整された R 二乗

12 人の異なる生徒に関する次の 3 つの変数を含む次のデータセットがあるとします。

学習時間現在の成績を予測変数として、試験の得点を応答変数として使用して重線形回帰モデルを近似し、次の結果が得られたとします。

複数の R と R 二乗

次の 3 つのメトリクスの値を観察できます。

複数の R: 0.978 。これは、応答変数と 2 つの予測変数間の多重相関を表します。

R 平方: 0.956 。これは、(Multiple R) 2 = (0.978) 2 = 0.956 として計算されます。これは、試験の得点の変動の 95.6% は、学生が勉強に費やした時間数とコースの現在の成績によって説明できることがわかります。

調整後の R 二乗: 0.946 。これは次のように計算されます。

調整後 R 2 = 1 – [(1-R 2 )*(n-1)/(nk-1)] = 1 – [(1-.956)*(12-1)/(12-2-1) ] = 0.946。

これは、モデル内の予測変数の数に合わせて調整されたR 二乗値を表します。

この測定は、たとえば、別の回帰モデルを 10 個の予測子で近似し、そのモデルの調整済み R 二乗が0.88であることが判明した場合に役立ちます。これは、2 つの予測子のみを使用した回帰モデルの方が調整された R 二乗値が高いため、より優れていることを示します。

追加リソース

重線形回帰の概要
適切な R 二乗値はどれくらいですか?

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です