A: so ändern sie die anzahl der bins im histogramm


Wenn Sie ein Histogramm in R erstellen, wird eine Formel namens Sturges-Regel verwendet, um die optimale Anzahl der zu verwendenden Gruppen zu bestimmen.

Sie können diese Formel jedoch mit der folgenden Syntax überschreiben und eine genaue Anzahl von Gruppen angeben, die im Histogramm verwendet werden sollen:

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

Beachten Sie, dass die Anzahl der im Histogramm verwendeten Gruppen um eins kleiner ist als die im Argument length.out angegebene Zahl.

Die folgenden Beispiele zeigen, wie Sie diese Syntax in der Praxis anwenden können.

Beispiel 1: Erstellen Sie ein einfaches Histogramm

Der folgende Code zeigt, wie man ein einfaches Histogramm in R erstellt, ohne die Anzahl der Bins anzugeben:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

Unter Verwendung der Sturges-Regel entschied R, insgesamt 8 Gruppen im Histogramm zu verwenden.

Beispiel 2: Geben Sie die Anzahl der im Histogramm zu verwendenden Bins an

Der folgende Code zeigt, wie man ein Histogramm für denselben Datenvektor erstellt und genau 6 Gruppen verwendet:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

Vorsichtsmaßnahmen für die Auswahl einer bestimmten Anzahl von Behältern

Die Anzahl der in einem Histogramm verwendeten Gruppen hat großen Einfluss darauf, wie wir einen Datensatz interpretieren.

Wenn wir zu wenige Gruppen verwenden, kann das wahre zugrunde liegende Muster in den Daten verborgen bleiben:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

Wenn wir umgekehrt zu viele Gruppen verwenden, können wir das Rauschen einfach in einem Datensatz visualisieren:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

Im Allgemeinen tendiert die in R verwendete Standardregel von Sturges dazu, Histogramme mit einer optimalen Anzahl von Gruppen zu erzeugen.

Fühlen Sie sich frei, den hier bereitgestellten Code zu verwenden, um ein Histogramm mit einer genauen Anzahl von Bins zu erstellen. Achten Sie jedoch darauf, nicht zu viele oder zu wenige Bins auszuwählen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere gängige Funktionen mit Histogrammen in R ausführen:

So zeichnen Sie mehrere Histogramme in R
So erstellen Sie ein Histogramm zweier Variablen in R
So erstellen Sie ein relatives Häufigkeitshistogramm in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert