So verwenden sie qq-plots zur überprüfung der normalität


Ein QQ-Plot, kurz für „Quantil-Quantil“, wird verwendet, um zu bewerten, ob ein Datensatz möglicherweise aus einer theoretischen Verteilung stammt.

In den meisten Fällen wird dieser Diagrammtyp verwendet, um zu bestimmen, ob ein Datensatz einer Normalverteilung folgt oder nicht.

Wenn die Daten normalverteilt sind, liegen die Punkte in einem QQ-Diagramm auf einer geraden diagonalen Linie.

Umgekehrt gilt: Je stärker die Punkte im Diagramm von einer geraden Diagonale abweichen, desto unwahrscheinlicher ist es, dass der Datensatz einer Normalverteilung folgt.

Die folgenden Beispiele zeigen, wie man QQ-Diagramme in R erstellt, um die Normalität zu überprüfen.

Beispiel 1: QQ-Diagramm für normale Daten

Der folgende Code zeigt, wie man einen normalverteilten Datensatz mit 200 Beobachtungen generiert und ein QQ-Diagramm für den Datensatz in R erstellt:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create QQ plot
qqnorm(data)
qqline(data)

Wir können sehen, dass die Punkte hauptsächlich entlang der geraden diagonalen Linie liegen, mit einigen geringfügigen Abweichungen entlang der einzelnen Enden.

Basierend auf dieser Grafik können wir mit Sicherheit davon ausgehen, dass dieser Datensatz normalverteilt ist.

Beispiel 2: QQ-Diagramm für nicht normale Daten

Der folgende Code zeigt, wie ein QQ-Diagramm für einen Datensatz erstellt wird, der einer Exponentialverteilung mit 200 Beobachtungen folgt:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create QQ plot
qqnorm(data)
qqline(data)

Wir sehen, dass die Punkte erheblich von der Diagonalen abweichen. Dies zeigt deutlich, dass der Datensatz nicht normalverteilt ist.

Dies sollte sinnvoll sein, da wir angegeben haben, dass die Daten einer Exponentialverteilung folgen sollen.

QQ-Diagramme und Histogramme

Es ist zu beachten, dass QQ-Plots eine Möglichkeit sind, visuell zu überprüfen, ob ein Datensatz einer Normalverteilung folgt oder nicht.

Eine andere Möglichkeit, die Normalität visuell zu überprüfen, besteht darin, ein Histogramm des Datensatzes zu erstellen. Wenn die Daten im Histogramm ungefähr einer Glockenkurve folgen, können wir davon ausgehen, dass der Datensatz normalverteilt ist.

So erstellen Sie beispielsweise ein Histogramm für den zuvor normalverteilten Datensatz:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows a normal distribution
data <- rnorm(200)

#create a histogram to visualize the distribution
hist(data) 

Und so erstellen Sie ein Histogramm für den Datensatz, der einer exponentiellen Prior-Verteilung folgt:

 #make this example reproducible
set. seeds (1)

#create some fake data that follows an exponential distribution
data <- rexp(200, rate=3)

#create a histogram to visualize the distribution
hist(data) 

Wir sehen, dass das Histogramm überhaupt nicht wie eine Glockenkurve aussieht, was deutlich darauf hinweist, dass die Daten keiner Normalverteilung folgen.

Zusätzliche Ressourcen

Was ist die Normalitätsannahme in der Statistik?
So erstellen Sie ein QQ-Diagramm in R
So erstellen Sie ein QQ-Diagramm in Excel
So erstellen Sie ein QQ-Diagramm in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert