Interquartilbereich und standardabweichung: was ist der unterschied?
Der Interquartilbereich und die Standardabweichung sind zwei Möglichkeiten, die Werteverteilung in einem Datensatz zu messen.
Dieses Tutorial bietet eine kurze Erläuterung jeder Metrik sowie die Ähnlichkeiten und Unterschiede zwischen den beiden.
Interquartilbereich
Der Interquartilbereich (IQR) eines Datensatzes ist die Differenz zwischen dem ersten Quartil (dem 25. Perzentil) und dem dritten Quartil (dem 75. Perzentil). Es misst die Verteilung der durchschnittlichen 50 % der Werte.
IQR = Q3 – Q1
Angenommen, wir haben den folgenden Datensatz:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Laut dem Interquartilbereichsrechner wird der Interquartilbereich (IQR) für diesen Datensatz wie folgt berechnet:
- T1: 12
- T3: 26,5
- IQR = Q3 – Q1 = 14,5
Dies sagt uns, dass die mittleren 50 % der Werte im Datensatz eine Abweichung von 14,5 aufweisen.
Standardabweichung
Die Standardabweichung eines Datensatzes ist eine Möglichkeit, die typische Abweichung einzelner Werte vom Mittelwert zu messen. Es wird wie folgt berechnet:
s = √(Σ(x i – x ) 2 / (n-1))
Angenommen, wir haben den folgenden Datensatz:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Mithilfe eines Taschenrechners können wir ermitteln, dass die Standardabweichung dieses Datensatzes 9,25 beträgt. Dies gibt uns eine Vorstellung davon, wie weit der typische Wert vom Durchschnitt entfernt ist.
Ähnlichkeiten und Unterschiede
Der Interquartilbereich und die Standardabweichung weisen die folgende Ähnlichkeit auf:
- Beide Metriken messen die Verteilung von Werten in einem Datensatz.
Der Interquartilbereich und die Standardabweichung weisen jedoch den folgenden wesentlichen Unterschied auf:
- Der Interquartilbereich (IQR) wird durch extreme Ausreißer nicht beeinflusst. Beispielsweise hat ein extrem kleiner oder extrem großer Wert in einem Datensatz keinen Einfluss auf die IQR-Berechnung, da der IQR nur die 25. Perzentil- und 75. Perzentilwerte des Datensatzes verwendet.
- Die Standardabweichung wird durch extreme Ausreißer beeinflusst. Beispielsweise führt ein extrem großer Wert in einem Datensatz zu einer viel größeren Standardabweichung, da die Standardabweichung jeden Wert in einem Datensatz in ihrer Formel verwendet.
Wann jeweils zu verwenden ist
Sie sollten den Interquartilbereich verwenden, um die Verteilung von Werten in einem Datensatz zu messen, wenn es extreme Ausreißer gibt.
Umgekehrt sollten Sie die Standardabweichung verwenden, um die Werteverteilung zu messen, wenn es keine extremen Ausreißer gibt.
Betrachten Sie zur Veranschaulichung des Grunds den folgenden Datensatz:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32
Zu Beginn des Artikels haben wir die folgenden Metriken für diesen Datensatz berechnet:
- IQR: 14,5
- Standardabweichung: 9,25
Bedenken Sie jedoch, ob der Datensatz einen extremen Ausreißer aufweist:
Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378
Wir könnten einen Rechner verwenden, um die folgenden Metriken für diesen Datensatz zu ermitteln:
- IQR: 15
- Standardabweichung: 85,02
Beachten Sie, dass sich der Interquartilbereich kaum ändert, wenn ein Ausreißer vorhanden ist, während die Standardabweichung von 9,25 auf 85,02 steigt.
Zusätzliche Ressourcen
Maße der zentralen Tendenz: Definition und Beispiele
Streuungsmaße: Definition und Beispiele
So finden Sie Ausreißer mithilfe des Interquartilbereichs