So finden sie ausreißer mithilfe des interquartilbereichs
Ein Ausreißer ist eine Beobachtung , die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist. Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können.
Eine gängige Methode zum Erkennen von Ausreißern in einem Datensatz ist die Verwendung des Interquartilbereichs .
Der Interquartilbereich, oft als IQR abgekürzt, ist die Differenz zwischen dem 25. Perzentil (Q1) und dem 75. Perzentil (Q3) in einem Datensatz. Es misst die Verteilung der durchschnittlichen 50 % der Werte.
Eine beliebte Methode besteht darin, eine Beobachtung als Ausreißer zu deklarieren, wenn ihr Wert 1,5-mal höher als der IQR oder 1,5-mal niedriger als der IQR ist.
Dieses Tutorial bietet ein schrittweises Beispiel dafür, wie Sie mit dieser Methode Ausreißer in einem Datensatz finden.
Schritt 1: Erstellen Sie die Daten
Angenommen, wir haben den folgenden Datensatz:
Schritt 2: Identifizieren Sie das erste und dritte Quartil
Das erste Quartil beträgt 5 und das dritte Quartil 20,75 .
Somit beträgt der Interquartilabstand 20,75 -5 = 15,75 .
Schritt 3: Finden Sie die Unter- und Obergrenzen
Die Untergrenze errechnet sich wie folgt:
Untere Grenze = Q1 – 1,5*IQR = 5 – 1,5*15,75 = -18,625
Und die Obergrenze berechnet sich wie folgt:
Obergrenze = Q3 + 1,5*IQR = 20,75 + 1,5*15,75 = 44,375
Schritt 4: Ausreißer identifizieren
Die einzige Beobachtung im Datensatz mit einem Wert unter der Untergrenze oder über der Obergrenze ist 46 . Dies ist also der einzige Ausreißer in diesem Datensatz.
Hinweis: Mit diesem Rechner für Ausreißergrenzen können Sie automatisch die Ober- und Untergrenzen von Ausreißern in einem bestimmten Datensatz ermitteln.
So finden Sie Ausreißer in der Praxis
In den folgenden Tutorials wird erläutert, wie Sie mithilfe des Interquartilbereichs in verschiedenen Statistiksoftware Ausreißer finden:
So finden Sie Ausreißer in Excel
So finden Sie Ausreißer in R
So finden Sie Ausreißer in Python
So finden Sie Ausreißer in SPSS