Was ist eine relative häufigkeitsverteilung?
Eine Häufigkeitsverteilung beschreibt, wie oft unterschiedliche Werte in einem Datensatz vorkommen.
Angenommen, wir sammeln eine einfache Zufallsstichprobe von 400 Haushalten in einer Stadt und erfassen die Anzahl der Haustiere in jedem Haushalt. Die folgende Tabelle zeigt die Ergebnisse:
Diese Tabelle stellt eine Häufigkeitsverteilung dar.
Eine verwandte Verteilung ist als relative Häufigkeitsverteilung bekannt, die die relative Häufigkeit jedes Werts in einem Datensatz als Prozentsatz aller Häufigkeiten angibt.
In der vorherigen Tabelle haben wir beispielsweise gesehen, dass es insgesamt 400 Haushalte gab. Um die relative Häufigkeit jedes Werts in der Verteilung zu ermitteln, teilen wir einfach jede einzelne Häufigkeit durch 400:
Beachten Sie, dass relative Häufigkeitsverteilungen die folgenden Eigenschaften haben:
- Jede einzelne relative Häufigkeit reicht von 0 % bis 100 %.
- Die Summe aller einzelnen relativen Häufigkeiten ergibt 100 %.
Wenn diese Bedingungen nicht erfüllt sind, ist die relative Häufigkeitsverteilung ungültig.
Warum relative Häufigkeitsverteilungen nützlich sind
Relative Häufigkeitsverteilungen sind nützlich, weil sie es uns ermöglichen zu verstehen, wie häufig ein Wert in einem Datensatz im Vergleich zu allen anderen Werten vorkommt.
Im vorherigen Beispiel haben wir gesehen, dass 150 Haushalte nur ein Haustier hatten. Aber diese Zahl allein ist nicht besonders nützlich.
Stattdessen ist es nützlicher zu wissen, dass 37,5 % aller Haushalte in der Stichprobe nur ein Haustier hatten. Dies hilft uns zu verstehen, dass etwas mehr als jeder dritte Haushalt nur ein Haustier hatte, was uns eine Vorstellung davon gibt, wie „häufig“ es ist, ein einziges Haustier zu besitzen.
Visualisierung einer relativen Häufigkeitsverteilung
Die gebräuchlichste Methode zur Visualisierung einer relativen Häufigkeitsverteilung besteht darin, ein relatives Häufigkeitshistogramm zu erstellen, das einzelne Datenwerte entlang der x-Achse eines Diagramms anzeigt und Balken verwendet, um die relativen Häufigkeiten jeder Klasse entlang der y-Achse darzustellen.
So würde beispielsweise ein relatives Häufigkeitshistogramm für die Daten aus unserem vorherigen Beispiel aussehen:
Die x-Achse zeigt die Anzahl der Haustiere im Haushalt und die y-Achse zeigt die relative Häufigkeit der Haushalte, die diese Anzahl von Haustieren besitzen.
Dieses Histogramm ist eine nützliche Möglichkeit, die relative Häufigkeitsverteilung zu visualisieren.
Zusätzliche Ressourcen
Relativer Frequenzrechner
So berechnen Sie die relative Häufigkeit in Excel
So berechnen Sie die relative Häufigkeit in Python
So erstellen Sie ein relatives Häufigkeitshistogramm in R