回帰直線

によるベンジャミン・アンダーソン博士 8月 2, 2023 統計 0コメント

この記事では統計における回帰直線とは何かについて説明します。したがって、2 つの変数間の回帰直線を計算する方法、解決された演習、さらに、データのサンプルの回帰直線を計算するためのオンライン計算機を見つけることができます。

回帰直線とは何ですか?

統計学における回帰直線は、単純な線形回帰モデルから得られる直線です。より正確には、回帰直線は散布図に最もよく適合する直線であり、したがって一連の統計データを最もよく表します。

したがって、回帰直線方程式は、データセットの独立変数 X と従属変数 Y を数学的に関連付けます。回帰直線は通常、各観測値の値を正確に決定することはできませんが、その値の近似値を得ることができます。

前のグラフでわかるように、回帰直線は、データセットの傾向と、独立変数と従属変数の間にどのような種類の関係が存在するかを確認するのに役立ちます。以下では回帰直線の応用を見ていきます。

回帰直線の式

回帰直線の定義がわかったので、線形回帰モデルの直線の方程式を計算する方法を見てみましょう。

他の直線と同様、回帰直線の方程式は定数 (b ₀ ) と傾き (b ₁ ) で構成されます。

$y=b_0+b_1x$

したがって、線形回帰直線の係数を計算する式は次のとおりです。

$\begin{array}{c}b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[12ex]b_0=\overline{y}-b_1\overline{x}\end{array}$

金：

$b_0$

回帰直線の定数です。
$b_1$

は回帰直線の傾きです。
$x_i$

データ i の独立変数 X の値です。
$y_i$

データ i の従属変数 Y の値です。
$\overline{x}$

独立変数の値の平均です
$\overline{y}$

従属変数 Y の値の平均です。

👉以下の計算機を使用して、任意のデータセットの回帰直線を計算できます。

回帰直線の具体例

回帰直線の概念をさらに詳しく調べるために、以下に回帰直線の作成方法の実例を示します。

統計試験を受けた後、5 人の学生が試験に費やした勉強時間について尋ねられました。データは以下の表に示されています。収集した統計データから回帰直線を計算し、学習時間と取得した成績を直線的に関連付けます。次に、8時間勉強した生徒が何級を受けるかを決定します。

サンプルデータの回帰直線を見つけるには、方程式の係数 b ₀と b ₁を決定する必要があります。これを行うには、上のセクションで示した式を使用する必要があります。

ただし、線形回帰直線の式を適用するには、まず独立変数の平均と従属変数の平均を計算する必要があります。

$\begin{array}{c}\overline{x}=\cfrac{11+5+10+12+7}{5}=9\\[4ex]\overline{y}=\cfrac{7+4+5+8+6}{5}=6\end{array}$

変数の平均がわかったので、対応する式を使用してモデルの係数 b ₁を計算します。

$\begin{array}{c}b_1=\cfrac{\displaystyle \sum_{i=1}^n (x_i-\overline{x})(y_i-\overline{y})}{\displaystyle \sum_{i=1}^n (x_i-\overline{x})^2}\\[10ex] b_1=\cfrac{\begin{array}{c}(11-9)(7-6)+(5-9)(4-6)+(10-9)(5-6)+\\+(12-9)(8-6)+(7-9)(6-6)\end{array}}{(11-9)^2+(5-9)^2+(10-9)^2+(12-9)^2+(7-9)^2}\\[6ex]b_1=0,4412\end{array}$