So erstellen und interpretieren sie qq-diagramme in stata


Ein QQ-Diagramm , kurz für „Quantil-Quantil“, wird häufig verwendet, um zu bewerten, ob die Residuen einer Regressionsanalyse normalverteilt sind oder nicht.

In diesem Tutorial wird erläutert, wie Sie ein QQ-Diagramm in Stata erstellen und interpretieren.

Beispiel: QQ-Diagramm in Stata

Für dieses Beispiel verwenden wir den in Stata integrierten automatischen Datensatz. Wir werden ein multiples lineares Regressionsmodell anpassen und dabei mpg und Verschiebung als erklärende Variablen und den Preis als Antwortvariable verwenden. Anschließend erhalten wir die Residuen für das Modell und erstellen ein QQ-Diagramm, um zu sehen, ob die Residuen einer Normalverteilung folgen.

Schritt 1: Daten laden und anzeigen.

Zuerst laden wir die Daten mit dem folgenden Befehl:

automatische Nutzung des Systems

Als nächstes erhalten wir mit dem folgenden Befehl eine kurze Zusammenfassung der Daten:

zusammenfassen

Fassen Sie die Bestellung in Stata zusammen

Schritt 2: Passen Sie das Regressionsmodell an.

Als nächstes verwenden wir den folgenden Befehl, um das Regressionsmodell anzupassen:

Regressionspreis mpg Hubraum

Ausgabe des Regressionsmodells in Stata

Schritt 3: Berechnen Sie die Residuen .

Denken Sie daran, dass ein Residuum einfach die Differenz zwischen dem vorhergesagten Antwortwert (wie durch die geschätzte Regressionsgleichung berechnet) und dem tatsächlichen Antwortwert ist.

Wir können die Residuen jeder Vorhersage erhalten, indem wir den Befehl „Residuen“ verwenden und diese Werte in einer Variablen mit einem beliebigen Namen speichern. In diesem Fall verwenden wir den Namen resid_price :

prognostizieren Sie den Residenzpreis und die Residuen

Schritt 4: Erstellen Sie das QQ-Diagramm.

Da wir nun eine Liste der Residuen haben, können wir mit dem Befehl qnorm ein QQ-Diagramm erstellen:

qnorm preis_resid

QQ-Diagramm in Stata

Schritt 5: Interpretieren Sie das QQ-Diagramm.

Die Idee hinter einem QQ-Diagramm ist einfach: Wenn die Residuen einer ungefähr geraden Linie in einem Winkel von 45 Grad folgen, sind die Residuen ungefähr normalverteilt. Wir können in unserem QQ-Diagramm oben sehen, dass die Residuen dazu neigen, etwas von der 45-Grad-Linie abzuweichen, insbesondere an den Enden, was darauf hindeuten könnte, dass sie nicht normalverteilt sind.

Obwohl es sich bei einem QQ-Diagramm nicht um einen formalen statistischen Test handelt, bietet er eine einfache Möglichkeit, visuell zu überprüfen, ob die Residuen normalverteilt sind oder nicht.

Wenn sich herausstellt, dass Ihre Residuen erheblich von der 45-Grad-Linie im QQ-Diagramm abweichen, können Sie eine Transformation der Antwortvariablen in Ihrer Regression in Betracht ziehen, beispielsweise mithilfe der Quadratwurzel oder des Logarithmus der Antwortvariablen.

Wenn die Residuen nur geringfügig abweichen, müssen Sie sich keine Gedanken über die Transformation der Antwortvariablen machen, da die Regression recht robust gegenüber Abweichungen von der Normalität ist.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert