So erstellen und interpretieren sie qq-diagramme in stata
Ein QQ-Diagramm , kurz für „Quantil-Quantil“, wird häufig verwendet, um zu bewerten, ob die Residuen einer Regressionsanalyse normalverteilt sind oder nicht.
In diesem Tutorial wird erläutert, wie Sie ein QQ-Diagramm in Stata erstellen und interpretieren.
Beispiel: QQ-Diagramm in Stata
Für dieses Beispiel verwenden wir den in Stata integrierten automatischen Datensatz. Wir werden ein multiples lineares Regressionsmodell anpassen und dabei mpg und Verschiebung als erklärende Variablen und den Preis als Antwortvariable verwenden. Anschließend erhalten wir die Residuen für das Modell und erstellen ein QQ-Diagramm, um zu sehen, ob die Residuen einer Normalverteilung folgen.
Schritt 1: Daten laden und anzeigen.
Zuerst laden wir die Daten mit dem folgenden Befehl:
automatische Nutzung des Systems
Als nächstes erhalten wir mit dem folgenden Befehl eine kurze Zusammenfassung der Daten:
zusammenfassen
Schritt 2: Passen Sie das Regressionsmodell an.
Als nächstes verwenden wir den folgenden Befehl, um das Regressionsmodell anzupassen:
Regressionspreis mpg Hubraum
Schritt 3: Berechnen Sie die Residuen .
Denken Sie daran, dass ein Residuum einfach die Differenz zwischen dem vorhergesagten Antwortwert (wie durch die geschätzte Regressionsgleichung berechnet) und dem tatsächlichen Antwortwert ist.
Wir können die Residuen jeder Vorhersage erhalten, indem wir den Befehl „Residuen“ verwenden und diese Werte in einer Variablen mit einem beliebigen Namen speichern. In diesem Fall verwenden wir den Namen resid_price :
prognostizieren Sie den Residenzpreis und die Residuen
Schritt 4: Erstellen Sie das QQ-Diagramm.
Da wir nun eine Liste der Residuen haben, können wir mit dem Befehl qnorm ein QQ-Diagramm erstellen:
qnorm preis_resid
Schritt 5: Interpretieren Sie das QQ-Diagramm.
Die Idee hinter einem QQ-Diagramm ist einfach: Wenn die Residuen einer ungefähr geraden Linie in einem Winkel von 45 Grad folgen, sind die Residuen ungefähr normalverteilt. Wir können in unserem QQ-Diagramm oben sehen, dass die Residuen dazu neigen, etwas von der 45-Grad-Linie abzuweichen, insbesondere an den Enden, was darauf hindeuten könnte, dass sie nicht normalverteilt sind.
Obwohl es sich bei einem QQ-Diagramm nicht um einen formalen statistischen Test handelt, bietet er eine einfache Möglichkeit, visuell zu überprüfen, ob die Residuen normalverteilt sind oder nicht.
Wenn sich herausstellt, dass Ihre Residuen erheblich von der 45-Grad-Linie im QQ-Diagramm abweichen, können Sie eine Transformation der Antwortvariablen in Ihrer Regression in Betracht ziehen, beispielsweise mithilfe der Quadratwurzel oder des Logarithmus der Antwortvariablen.
Wenn die Residuen nur geringfügig abweichen, müssen Sie sich keine Gedanken über die Transformation der Antwortvariablen machen, da die Regression recht robust gegenüber Abweichungen von der Normalität ist.