So identifizieren sie asymmetrie in boxplots
Ein Boxplot ist eine Art Diagramm, das die fünfstellige Zusammenfassung eines Datensatzes anzeigt, der Folgendes umfasst:
- Der Mindestwert
- Das erste Quartil (das 25. Perzentil)
- Der Medianwert
- Das dritte Quartil (das 75. Perzentil)
- Der Maximalwert
Wir verwenden den folgenden Prozess, um einen Boxplot zu zeichnen:
- Zeichnen Sie ein Kästchen vom ersten Quartil (Q1) bis zum dritten Quartil (Q3).
- Zeichnen Sie dann eine Linie innerhalb des Kästchens am Mittelwert
- Zeichnen Sie dann „Schnurrhaare“ der Quartile zu den Minimal- und Maximalwerten.
Wir können anhand der Position des Medianwerts im Boxplot bestimmen, ob eine Verteilung schief ist oder nicht.
Wenn der Median näher am Boden der Box liegt und der Whisker am unteren Ende der Box kürzer ist, ist die Verteilung rechtsschief (oder „positiv“ schief).
Wenn der Median näher am oberen Rand des Kastens liegt und der Whisker am oberen Ende des Kastens kürzer ist, bleibt die Verteilung schief (oder „negativ“ schief).
Wenn der Median in der Mitte der Box liegt und die Whiskers auf beiden Seiten ungefähr gleich sind, ist die Verteilung symmetrisch (oder „nicht“ asymmetrisch).
Die folgenden Beispiele veranschaulichen, wie Sie Boxplots verwenden, um zu bestimmen, ob eine Verteilung rechtsschief, linksschief oder ohne Schiefe ist.
Beispiel 1: Rechtsschiefe Verteilung
Die Verteilung des jährlichen Haushaltseinkommens in den Vereinigten Staaten ist rechtsschief. Die meisten Haushalte verdienen zwischen 40.000 und 80.000 US-Dollar pro Jahr, aber es gibt einen langen rechten Rand in der Verteilung, der Haushalte darstellt, die viel mehr verdienen.
Wenn wir ein Boxplot erstellen würden, um die Verteilung des Haushaltseinkommens zu visualisieren, würde es so aussehen:
Beachten Sie, dass die vertikale Linie innerhalb des Kästchens, die den Median darstellt, viel näher am ersten Quartil als am dritten Quartil liegt, was bedeutet, dass die Verteilung nach rechts verzerrt ist.
Beispiel 2: linksschiefe Verteilung
Die Altersverteilung der Todesfälle ist in den meisten Bevölkerungsgruppen linksschief. Die meisten Menschen leben zwischen 70 und 80 Jahren, und immer weniger leben darunter.
Wenn wir ein Boxplot erstellen würden, um die Altersverteilung der Todesfälle zu visualisieren, würde es so aussehen:
Beachten Sie, dass die vertikale Linie innerhalb des Kästchens, die den Median darstellt, viel näher am dritten Quartil als am ersten Quartil liegt, was bedeutet, dass die Verteilung nach links verzerrt ist.
Beispiel 3: Symmetrische Verteilung
Die Größenverteilung der Männchen ist annähernd symmetrisch und weist keine Asymmetrie auf. Beispielsweise beträgt die durchschnittliche Größe eines Mannes in den Vereinigten Staaten etwa 69,1 Zoll. Die Höhenverteilung ist ungefähr symmetrisch, wobei einige kürzer und andere höher sind.
Wenn wir ein Boxplot erstellen würden, um die Verteilung der männlichen Körpergröße in den Vereinigten Staaten zu visualisieren, würde es so aussehen:
Beachten Sie, dass die vertikale Linie innerhalb des Kästchens, die den Median darstellt, ebenfalls nahe am ersten und dritten Quartil liegt, was bedeutet, dass die Verteilung symmetrisch und ohne Schiefe ist.
Zusätzliche Ressourcen
Links- oder rechtsschiefe Verteilungen
So vergleichen Sie Boxplots: Mit Beispielen
So erstellen Sie Boxplots nebeneinander in Excel