Stataで予測値と残差を取得する方法
線形回帰は、1 つ以上の説明変数と応答変数の間の関係を理解するために使用できる方法です。
データセットに対して線形回帰を実行すると、説明変数の値を考慮して応答変数の値を予測するために使用できる回帰式が得られます。
次に、予測値と実際の値の差を測定して、各予測の残差を取得します。これは、回帰モデルが応答値をどの程度正確に予測するかを把握するのに役立ちます。
このチュートリアルでは、Stata で回帰モデルの予測値と残差の両方を取得する方法について説明します。
例: 予測値と残差の取得方法
この例では、 autoという組み込みの Stata データセットを使用します。説明変数としてmpgと変位を使用し、応答変数として価格を使用します。
次の手順を使用して線形回帰を実行し、回帰モデルの予測値と残差を取得します。
ステップ 1: データをロードして表示します。
まず、次のコマンドを使用してデータをロードします。
システムの自動使用
次に、次のコマンドを使用して、データの簡単な概要を取得します。
要約する
ステップ 2: 回帰モデルを当てはめます。
次に、次のコマンドを使用して回帰モデルを当てはめます。
回帰価格 mpg 変位
推定される回帰式は次のとおりです。
推定価格 = 6672.766 -121.1833*(mpg) + 10.50885*(排気量)
ステップ 3: 予測値を取得します。
予測値を取得するには、 predictコマンドを使用し、これらの値を任意の名前の変数に保存します。この場合、 pred_price という名前を使用します。
pred_price を予測する
listコマンドを使用すると、実際の価格と予測価格を並べて表示できます。予測値は合計 74 個ありますが、 in 1/10コマンドを使用して最初の 10 個だけを表示します。
定価 pred_price (1/10)
ステップ 4: 残留物を取得します。
残差コマンドを使用し、これらの値を任意の名前の変数に保存することで、各予測の残差を取得できます。この場合、 resid_priceという名前を使用します。
居住価格、残差を予測する
listコマンドを再度使用すると、実際の価格、予想価格、残差を並べて表示できます。
定価 pred_price resid_price (1/10)
ステップ 5: 残差に対する予測値のプロットを作成します。
最後に、散布図を作成して、予測値と残差の関係を視覚化できます。
分散 reside_price pred_price
平均して、近似値が増加するにつれて残差が増加する傾向があることがわかります。これは、残差の分布が各応答レベルで一定ではない場合、不均一分散性の兆候である可能性があります。
Breusch-Pagan テストを使用して不均一分散性を正式にテストし、堅牢な標準誤差を使用してこれに対処できます。