So finden sie ganz einfach ausreißer in excel
Ein Ausreißer ist eine Beobachtung , die ungewöhnlich weit von anderen Werten in einem Datensatz entfernt ist.
Ausreißer können problematisch sein, da sie die Ergebnisse einer Analyse beeinflussen können.
Wir verwenden den folgenden Datensatz in Excel, um zwei Methoden zum Auffinden von Ausreißern zu demonstrieren:
Verwandte Themen: So berechnen Sie den Mittelwert ohne Ausreißer in Excel
Methode 1: Verwenden Sie den Interquartilbereich
Der Interquartilbereich (IQR) ist die Differenz zwischen dem 75. Perzentil (Q3) und dem 25. Perzentil (Q1) in einem Datensatz. Es misst die Verteilung der durchschnittlichen 50 % der Werte.
Wir können eine Beobachtung als Ausreißer definieren, wenn sie das 1,5-fache des Interquartilbereichs oberhalb des dritten Quartils (Q3) oder das 1,5-fache des Interquartilbereichs unterhalb des ersten Quartils (Q1) beträgt.
Das folgende Bild zeigt, wie der Interquartilbereich in Excel berechnet wird:
Dann können wir die oben genannte Formel verwenden, um allen Ausreißern im Datensatz eine „1“ zuzuweisen:
Wir sehen, dass sich in diesem Datensatz nur ein Wert – 164 – als Ausreißer herausstellt.
Methode 2: Z-Scores verwenden
Ein Z-Score sagt Ihnen, wie viele Standardabweichungen ein bestimmter Wert vom Mittelwert hat. Wir verwenden die folgende Formel, um einen Z-Score zu berechnen:
z = (X – μ) / σ
Gold:
- X ist ein einzelner Rohdatenwert
- μ ist der Bevölkerungsmittelwert
- σ ist die Populationsstandardabweichung
Wir können eine Beobachtung als Ausreißer definieren, wenn sie einen Z-Score von weniger als -3 oder mehr als 3 hat.
Das folgende Bild zeigt, wie Sie den Mittelwert und die Standardabweichung eines Datensatzes in Excel berechnen:
Anschließend können wir den Mittelwert und die Standardabweichung verwenden, um den Z-Score für jeden einzelnen Wert im Datensatz zu ermitteln:
Wir können dann jedem Wert, dessen Z-Score kleiner als -3 oder größer als 3 ist, eine „1“ zuweisen:
Mit dieser Methode stellen wir fest, dass der Datensatz keine Ausreißer enthält.
Hinweis: Manchmal wird ein Z-Score von 2,5 anstelle von 3 verwendet. In diesem Fall würde der Einzelwert von 164 als Ausreißer betrachtet, da er einen Z-Score von mehr als 2,5 aufweist.
Wenn Sie die Z-Score-Methode verwenden, bestimmen Sie anhand Ihres Urteilsvermögens, welchen Z-Score-Wert Sie als Ausreißer betrachten.
Wie man mit Ausreißern umgeht
Wenn in Ihren Daten ein Ausreißer vorhanden ist, haben Sie mehrere Möglichkeiten:
1. Stellen Sie sicher, dass der Ausreißer nicht auf einen Dateneingabefehler zurückzuführen ist.
Manchmal gibt eine Person beim Speichern der Daten einfach den falschen Datenwert ein. Wenn ein Ausreißer vorhanden ist, überprüfen Sie zunächst, ob der Wert korrekt eingegeben wurde und kein Fehler vorliegt.
2. Entfernen Sie den Ausreißer.
Wenn der Wert wirklich ein Ausreißer ist, können Sie ihn entfernen, wenn er erhebliche Auswirkungen auf Ihre Gesamtanalyse hat. Erwähnen Sie in Ihrem Abschlussbericht oder Ihrer Analyse unbedingt, dass Sie einen Ausreißer entfernt haben.
3. Weisen Sie dem Ausreißer einen neuen Wert zu .
Wenn der Ausreißer das Ergebnis eines Dateneingabefehlers ist, können Sie ihm einen neuen Wert zuweisen, beispielsweise den Mittelwert oder Median des Datensatzes.