Was ist eine bimodale verteilung?
Eine bimodale Verteilung ist eine Wahrscheinlichkeitsverteilung mit zwei Modi.
In derdeskriptiven Statistik verwenden wir den Begriff „Modus“ häufig, um den häufigsten Wert in einem Datensatz zu bezeichnen. In diesem Fall bezieht sich der Begriff „Modus“ jedoch auf ein lokales Maximum in einem Diagramm.
Wenn Sie eine bimodale Verteilung betrachten, werden Sie zwei deutliche „Peaks“ bemerken, die diese beiden Modi darstellen.
Dies unterscheidet sich von einer unimodalen Verteilung, die nur einen Peak aufweist:
Sie können sich den Unterschied zwischen den beiden merken, indem Sie sich Folgendes merken:
- „bi“ = zwei
- „vereint“ = eins
Obwohl die meisten Statistikkurse unimodale Verteilungen wie die Normalverteilung verwenden, um verschiedene Themen zu erklären, kommen bimodale Verteilungen in der Praxis recht häufig vor, daher ist es nützlich zu wissen, wie man sie erkennt und interpretiert.
Hinweis: Eine bimodale Verteilung ist eine spezielle Art der multimodalen Verteilung .
Beispiele für bimodale Verteilungen
Hier sind einige Beispiele für bimodale Verteilungen:
Beispiel Nr. 1: Restaurant-Spitzenzeiten
Wenn Sie ein Diagramm erstellen würden, um die stündliche Verteilung der Kunden in einem bestimmten Restaurant zu visualisieren, würden Sie wahrscheinlich feststellen, dass es einer bimodalen Verteilung mit einem Höhepunkt während der Mittagsstunden und einem weiteren Höhepunkt während der Abendessenzeiten folgt:
Beispiel Nr. 2: Durchschnittliche Höhe zweier Pflanzenarten
Angenommen, Sie gehen um ein Feld herum und messen die Höhe verschiedener Pflanzen. Ohne es zu merken, messen Sie die Größe zweier verschiedener Arten: einer ziemlich groß und einer ziemlich klein. Wenn Sie ein Diagramm zur Visualisierung der Höhenverteilung erstellen würden, würde es einer bimodalen Verteilung folgen:
Beispiel #3: Prüfungsergebnisse
Angenommen, ein Lehrer gibt seinen Schülern eine Prüfung. Einige Schüler lernten für die Prüfung, andere nicht. Wenn der Lehrer ein Diagramm der Prüfungsergebnisse erstellt, folgt es einer bimodalen Verteilung mit einem Höhepunkt bei niedrigen Werten für Schüler, die nicht gelernt haben, und einem weiteren Höhepunkt bei hohen Werten für Schüler, die gelernt haben:
Was verursacht bimodale Verteilungen?
Es gibt im Allgemeinen zwei Dinge, die bimodale Verteilungen verursachen:
1. Einige zugrunde liegende Phänomene.
Bimodale Verteilungen treten häufig aufgrund bestimmter zugrunde liegender Phänomene auf.
Beispielsweise folgt die Anzahl der Kunden, die stündlich ein Restaurant besuchen, einer bimodalen Verteilung, da Menschen dazu neigen, zu zwei unterschiedlichen Zeiten in Restaurants zu essen: Mittag- und Abendessen. Dieses zugrunde liegende menschliche Verhalten ist der Ursprung der bimodalen Verteilung.
2. Zwei verschiedene Gruppen gruppieren sich.
Bimodale Verteilungen können auch auftreten, wenn Sie einfach zwei verschiedene Gruppen von Dingen analysieren, ohne es zu merken.
Wenn Sie beispielsweise die Höhe von Pflanzen auf einem bestimmten Feld messen, ohne zu bemerken, dass auf demselben Feld zwei verschiedene Arten wachsen, sehen Sie beim Erstellen eines Diagramms eine bimodale Verteilung.
So analysieren Sie bimodale Verteilungen
Wir beschreiben Verteilungen oft mit dem Mittelwert oder Median, weil uns dies eine Vorstellung davon gibt, wo sich das „Zentrum“ der Verteilung befindet.
Leider sind Mittelwert und Median für eine bimodale Verteilung nicht hilfreich. Beispielsweise beträgt die durchschnittliche Prüfungspunktzahl der Studierenden im obigen Beispiel 81:
Allerdings erzielten nur sehr wenige Schüler auch nur annähernd 81 Punkte. In diesem Fall ist der Durchschnitt irreführend. Die meisten Schüler erzielten tatsächlich Werte um die 74 oder 88.
Eine bessere Möglichkeit, bimodale Verteilungen zu analysieren und zu interpretieren, besteht darin, die Daten einfach in zwei verschiedene Gruppen zu unterteilen und dann das Zentrum und die Verteilung für jede Gruppe zu analysieren.
Beispielsweise können wir Prüfungsergebnisse in „niedrige Punktzahlen“ und „hohe Punktzahlen“ unterteilen und dann den Mittelwert und die Standardabweichung für jede Gruppe ermitteln.
Wenn Sie die Ergebnisse einer Analyse teilen und Ihre Daten einer bimodalen Verteilung folgen, ist es hilfreich, ein Histogramm wie die oben gezeigten zu erstellen, damit Ihr Publikum klar erkennen kann, dass die Verteilung zwei unterschiedliche „Spitzen“ aufweist und dass es nur solche gibt sinnvoll, jeden Peak einzeln zu analysieren und nicht als einen großen Datensatz.