Hoe maak je een relatief frequentiehistogram in r
Een relatief frequentiehistogram is een grafiek die de relatieve frequenties van waarden in een dataset weergeeft.
In deze zelfstudie wordt uitgelegd hoe u een relatief frequentiehistogram in R kunt maken met behulp van de functie roosterhistogram () , die de volgende syntaxis gebruikt:
histogram (x, type)
Goud:
- x: gegevens
- type: type relatief frequentiehistogram dat u wilt maken; opties omvatten percentage, aantal en dichtheid.
Standaardhistogram
Laad eerst het roosterpakket :
library(lattice)
Standaard maakt dit pakket een relatief frequentiehistogram met een percentage langs de y-as:
#create data data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14) #create relative frequency histogram histogram(data)
Het histogram bewerken
We kunnen het histogram aanpassen om een titel, verschillende aslabels en een andere kleur op te nemen met behulp van de volgende argumenten:
- belangrijkste: de titel
- xlab: x-aslabel
- ylab: het label van de y-as
- col: de vulkleur die in het histogram moet worden gebruikt
Bijvoorbeeld:
#modify the histogram
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue')
Het aantal bakken wijzigen
We kunnen het aantal te gebruiken bakken in het histogram specificeren met behulp van het breaks- argument:
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=15 )
Hoe meer categorieën u opgeeft, hoe gedetailleerder inzicht u in uw gegevens kunt krijgen. Omgekeerd geldt: hoe minder categorieën u opgeeft, hoe geaggregeerder de gegevens worden:
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=3 )
Gerelateerd: Gebruik de regel van Sturges om het optimale aantal groepen te identificeren dat in een histogram kan worden gebruikt.