So legen sie die anzahl der bins für ein histogramm in ggplot2 fest
Mit dem Argument bins können Sie die Anzahl der in einem Histogramm in ggplot2 zu verwendenden Bins angeben:
library (ggplot2) ggplot(df, aes (x=x)) + geom_histogram(bins= 10 )
Die folgenden Beispiele zeigen, wie dieses Argument in der Praxis verwendet werden kann.
Beispiel: Anzahl der Bins für das Histogramm in ggplot2 festlegen
Der folgende Code zeigt, wie man in R einen Datensatz mit 10.000 Zufallswerten erstellt, der einer Poisson-Verteilung mit einem Mittelwert von 2 folgt:
#make this example reproducible
set. seeds (0)
#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))
#view first five rows of data frame
head(df)
values
1 4
2 1
3 1
4 2
5 4
6 1
Mit dem folgenden Code können wir in ggplot2 ein Histogramm erstellen, um die Werteverteilung im Datenrahmen zu visualisieren:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ')
Standardmäßig wählt ggplot2 automatisch eine bestimmte Anzahl von Feldern aus, die im Histogramm verwendet werden sollen.
Wir können jedoch die folgende Syntax verwenden, um anzugeben, dass das Histogramm 10 Bins verwenden soll:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 10 )
Beachten Sie, dass das Histogramm jetzt genau 10 Kästchen enthält.
Oder wir könnten die folgende Syntax verwenden, um anzugeben, dass das Histogramm 5 Bins verwenden soll:
library (ggplot2)
ggplot(df, aes (x=values)) +
geom_histogram(fill=' steelblue ', col=' black ', bins= 5 )
Beachten Sie, dass das Histogramm jetzt genau 5 Kästchen enthält.
Sie werden feststellen, dass jeder Behälter umso breiter ist, je weniger Behälter Sie verwenden.
Wenn Sie zu wenige Gruppen verwenden, wird im Allgemeinen die tatsächliche zugrunde liegende Werteverteilung ausgeblendet.
Wenn Sie jedoch zu viele Gruppen verwenden, besteht die Gefahr, dass in den Daten einfach Rauschen auftritt.
Eine Möglichkeit, die optimale Anzahl von Bins für ein Histogramm zu ermitteln, ist die Verwendung der Sturges-Regel . Erfahren Sie hier mehr über diese Regel.
Hinweis : Die vollständige Dokumentation zur Funktion geom_histogram finden Sie hier .
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie man andere gängige Diagramme in R erstellt:
So erstellen Sie ein relatives Häufigkeitshistogramm in R
So zeichnen Sie mehrere Boxplots in einem einzigen Diagramm in R
So zeichnen Sie mehrere Linien in einem Diagramm in R