Punktdiagramm und histogramm: was ist der unterschied?


Zwei häufig verwendete Diagramme zur Visualisierung der Werteverteilung in einem Datensatz sind Punktdiagramme und Histogramme .

Ein Punktdiagramm zeigt einzelne Datenwerte entlang der x-Achse an und verwendet Punkte, um die Häufigkeit jedes einzelnen Werts darzustellen.

Ein Histogramm zeigt Datenbereiche entlang der x-Achse an und verwendet rechteckige Balken, um die Häufigkeiten der zu jedem Bereich gehörenden Werte darzustellen.

Das folgende Beispiel zeigt, wie ein Punktdiagramm und ein Histogramm für denselben Datensatz erstellt werden.

Beispiel: Erstellen eines Punktdiagramms und eines Histogramms für denselben Datensatz

Angenommen, wir haben den folgenden Datensatz mit 18 Werten:

Daten: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10

So würde ein Punktdiagramm für diesen Datensatz aussehen:

Die x-Achse zeigt einzelne Datenwerte und die y-Achse zeigt die Häufigkeit jedes Werts.

Wir können beispielsweise sehen, dass der Wert „2“ dreimal im Datensatz vorkommt, weil darüber drei Punkte liegen. Ebenso können wir erkennen, dass der Wert „3“ nur einmal vorkommt, da sich nur ein Punkt darüber befindet.

Und so würde ein Histogramm für diesen Datensatz aussehen:

Das Aufgeräumte.

Wir können beispielsweise sehen, dass sieben Werte zwischen 0 und 2 liegen, zwei Werte zwischen 2 und 4 und so weiter.

Bonus : Für diejenigen, die neugierig sind: Wir haben den folgenden R-Code verwendet, um das oben gezeigte Punktdiagramm und Histogramm zu erstellen:

 #define dataset
data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10)

#create dot plot
stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5,
           col = "steelblue", main = "Dot Plot",
           xlab = "Data Values", ylab="Frequency")

#create histogram
hist(data, col='steelblue', main='Histogram', xlab='Data Values')

Punktdiagramm oder Histogramm: Was sollten Sie verwenden?

Wie bereits erwähnt, können ein Punktdiagramm und ein Histogramm verwendet werden, um die Verteilung von Werten in einem Datensatz zu visualisieren.

Als Faustregel gilt, dass wir Punktdiagramme normalerweise verwenden, wenn unser Datensatz klein ist, da wir so genau sehen können, wie oft jeder einzelne Wert vorkommt.

Umgekehrt verwenden wir normalerweise Histogramme, wenn unser Datensatz groß ist, da es mühsam ist, einen Punkt zu erstellen, um jeden einzelnen Wert in einem großen Datensatz darzustellen.

Bedenken Sie, dass der einzige Nachteil bei der Verwendung eines Histogramms darin besteht, dass wir nicht genau sagen können, wie oft jeder einzelne Wert vorkommt.

Im vorherigen Histogramm haben wir beispielsweise gesehen, dass sieben Werte zwischen 0 und 2 lagen, aber wir wissen nicht genau, wie viele Werte 1 und wie viele Werte 2 waren.

Wenn wir nur die allgemeine „Form“ einer Verteilung verstehen wollen, dann spielt es im Allgemeinen keine Rolle, wenn wir die einzelnen Werte eines Datensatzes nicht kennen.

Bedenken Sie auch, dass wir den genauen Median oder Durchschnitt nicht allein anhand eines Histogramms berechnen können, da wir die einzelnen Werte nicht kennen.

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zu Histogrammen:

So schätzen Sie die Mittelwert- und Median-Histogramme ein
So beschreiben Sie die Form von Histogrammen
So erstellen Sie Histogramme in R
So erstellen Sie ein Histogramm in Python

Die folgenden Tutorials bieten zusätzliche Informationen zu Punktdiagrammen:

So ermitteln Sie den Mittelpunkt und die Ausbreitung eines Punktdiagramms
So erstellen Sie ein Punktdiagramm in Google Sheets
So erstellen Sie ein Punktdiagramm in Excel
So erstellen Sie ein Punktdiagramm in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert