So erstellen sie ein relatives häufigkeitshistogramm in r


Ein relatives Häufigkeitshistogramm ist ein Diagramm, das die relativen Häufigkeiten von Werten in einem Datensatz anzeigt.

In diesem Tutorial wird erläutert, wie Sie mit der Funktion lattice histogram() ein relatives Häufigkeitshistogramm in R erstellen, das die folgende Syntax verwendet:

Histogramm (x, Typ)

Gold:

  • x: Daten
  • Typ: Typ des relativen Häufigkeitshistogramms, das Sie erstellen möchten; Zu den Optionen gehören Prozentsatz, Anzahl und Dichte.

Standardhistogramm

Laden Sie zunächst das Lattice- Paket:

 library(lattice)

Standardmäßig erstellt dieses Paket ein relatives Häufigkeitshistogramm mit Prozentsatz entlang der y-Achse:

 #create data
data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14)

#create relative frequency histogram
histogram(data) 

Relatives Häufigkeitshistogramm in R

Bearbeiten des Histogramms

Mit den folgenden Argumenten können wir das Histogramm so ändern, dass es einen Titel, andere Achsenbeschriftungen und eine andere Farbe enthält:

  • main: der Titel
  • xlab: Beschriftung der x-Achse
  • ylab: die Beschriftung der y-Achse
  • col: Die im Histogramm zu verwendende Füllfarbe

Zum Beispiel:

 #modify the histogram
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue')

Histogramm der relativen Häufigkeit in R unter Verwendung des Trellis-Pakets

Ändern der Anzahl der Behälter

Mit dem Argument breaks können wir die Anzahl der im Histogramm zu verwendenden Bins angeben:

 #modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=15 )

Relatives Häufigkeitshistogramm mit angepassten Bins in R

Je mehr Kategorien Sie angeben, desto detailliertere Einblicke erhalten Sie in Ihre Daten. Umgekehrt gilt: Je weniger Kategorien Sie angeben, desto aggregierter werden die Daten:

 #modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=3 )

Relatives Häufigkeitshistogramm in R

Verwandte Themen: Verwenden Sie die Sturges-Regel , um die optimale Anzahl von Gruppen für die Verwendung in einem Histogramm zu ermitteln.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert