Stata で qq プロットを作成および解釈する方法


QQ プロット(「分位数-分位数」の略) は、回帰分析からの残差が正規分布しているかどうかを評価するためによく使用されます。

このチュートリアルでは、Stata で QQ プロットを作成および解釈する方法を説明します。

例: Stata の QQ プロット

この例では、Stata に組み込まれている自動データセットを使用します。 mpg変位を説明変数として、価格を応答変数として使用して、重線形回帰モデルを近似します。次に、モデルの残差を取得し、QQ プロットを作成して、残差が正規分布に従っているかどうかを確認します。

ステップ 1: データをロードして表示します。

まず、次のコマンドを使用してデータをロードします。

システムの自動使用

次に、次のコマンドを使用して、データの簡単な概要を取得します。

要約する

Stata で注文を要約する

ステップ 2: 回帰モデルを当てはめます。

次に、次のコマンドを使用して回帰モデルを当てはめます。

回帰価格 mpg 変位

Stata での回帰モデルの出力

ステップ 3: 残差を計算します

残差は、単に予測された応答値 (推定された回帰式によって計算されたもの) と実際の応答値の差であることを思い出してください。

残差コマンドを使用し、これらの値を任意の名前の変数に保存することで、各予測の残差を取得できます。この場合、 resid_priceという名前を使用します。

居住価格、残差を予測する

ステップ 4: QQ プロットを作成します。

残基のリストが得られたので、 qnormコマンドを使用して QQ プロットを作成できます。

qnorm 価格_resid

Stata の QQ プロット

ステップ 5: QQ プロットを解釈します。

QQ プロットの背後にある考え方は単純です。残差が角度 45 度のほぼ直線に従う場合、残差はほぼ正規分布します。上の QQ プロットでは、残差が、特に端で 45 度の線から少し逸脱する傾向があることがわかります。これは、残差が正規分布していないことを示している可能性があります。

QQ プロットは正式な統計検定ではありませんが、残差が正規分布しているかどうかを視覚的に確認する簡単な方法を提供します。

残差が QQ プロットの 45 度の線から大きく逸脱していることが判明した場合は、回帰で応答変数に変換を実行することを検討してください。たとえば、応答変数の平方根や対数を使用します。

残差がわずかに逸脱する場合、回帰は正規性からの逸脱に対して非常に強いため、応答変数の変換について心配する必要はありません。

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です