So interpretieren sie den interquartilbereich: mit beispielen


Der Interquartilbereich eines Datensatzes, oft als IQR abgekürzt, ist die Differenz zwischen dem ersten Quartil (dem 25. Perzentil) und dem dritten Quartil (dem 75. Perzentil) des Datensatzes.

Vereinfacht ausgedrückt misst es die Abweichung zwischen den mittleren 50 % der Werte.

IQR = Q3 – Q1

Angenommen, wir haben den folgenden Datensatz, der die Höhe von 17 verschiedenen Pflanzen (in Zoll) in einem Labor zeigt:

Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Laut dem Interquartilbereichsrechner wird der Interquartilbereich (IQR) für diesen Datensatz wie folgt berechnet:

  • T1: 12
  • T3: 26,5
  • IQR = Q3 – Q1 = 14,5

Dies sagt uns, dass die mittleren 50 % der Werte im Datensatz eine Streuung von 14,5 Zoll aufweisen.

Warum der Interquartilbereich nützlich ist

Der Interquartilbereich ist eine Möglichkeit, die Verteilung von Werten in einem Datensatz zu messen, es gibt jedoch auch andere Verteilungsmaße wie:

  • Bereich: Misst die Differenz zwischen dem Minimal- und Maximalwert in einem Datensatz.
  • Standardabweichung: Misst die typische Abweichung einzelner Werte vom Durchschnittswert in einem Datensatz.

Der Vorteil der Verwendung des Interquartilbereichs (IQR) zur Messung der Werteverteilung in einem Datensatz besteht darin, dass er nicht durch extreme Ausreißer beeinflusst wird.

Beispielsweise hat ein extrem kleiner oder extrem großer Wert in einem Datensatz keinen Einfluss auf die IQR-Berechnung, da der IQR nur die 25. Perzentil- und 75. Perzentilwerte des Datensatzes verwendet.

Betrachten Sie zur Veranschaulichung den folgenden Datensatz:

Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Dieser Datensatz enthält die folgenden Ausbreitungsmessungen

  • IQR: 14,5
  • Standardabweichung: 9,25
  • Bereich: 31

Bedenken Sie jedoch, ob der Datensatz einen extremen Ausreißer aufweist:

Datensatz: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32, 378

Wir könnten einen Rechner verwenden, um die folgenden Spread-Messungen für diesen Datensatz zu ermitteln:

  • IQR: 15
  • Standardabweichung: 85,02
  • Bereich: 377

Beachten Sie, dass sich der Interquartilbereich kaum ändert, wenn ein Ausreißer vorhanden ist, während sich sowohl die Standardabweichung als auch der Bereich dramatisch ändern.

Vergleich der Interquartilbereiche zwischen Datensätzen

Der Interquartilbereich kann auch verwendet werden, um die Werteverteilung zwischen verschiedenen Datensätzen zu vergleichen.

Angenommen, wir haben drei Datensätze mit den folgenden IQR-Werten:

  • IQR von Datensatz 1: 13,5
  • IQR von Datensatz 2: 24,4
  • Datensatz 3 IQR: 8,7

Dies zeigt uns, dass die Lücke zwischen den mittleren 50 % der Werte für Datensatz 2 am größten und für Datensatz 3 am kleinsten ist.

Zusätzliche Ressourcen

So berechnen Sie den Interquartilbereich in Excel
So berechnen Sie den Interquartilbereich in Python
So finden Sie Ausreißer mithilfe des Interquartilbereichs
Interquartilbereichsrechner

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert