Comment créer un histogramme de fréquence relative dans R
Un histogramme de fréquence relative est un graphique qui affiche les fréquences relatives des valeurs dans un ensemble de données.
Ce tutoriel explique comment créer un histogramme de fréquence relative dans R en utilisant la fonction histogram() du lattice , qui utilise la syntaxe suivante :
histogramme (x, type)
où:
- x : données
- type : type d’histogramme de fréquence relative que vous souhaitez créer ; les options incluent le pourcentage, le nombre et la densité.
Histogramme par défaut
Tout d’abord, chargez le package lattice :
library(lattice)
Par défaut, ce package crée un histogramme de fréquence relative avec un pourcentage le long de l’axe y :
#create data data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14) #create relative frequency histogram histogram(data)
Modification de l’histogramme
Nous pouvons modifier l’histogramme pour inclure un titre, différentes étiquettes d’axes et une couleur différente en utilisant les arguments suivants :
- principal : le titre
- xlab : l’étiquette de l’axe des x
- ylab : l’étiquette de l’axe y
- col : la couleur de remplissage à utiliser dans l’histogramme
Par exemple:
#modify the histogram
histogram(data,
main='Points per Game by Player',
xlab='Points per Game',
col='steelblue')
Modification du nombre de bacs
Nous pouvons spécifier le nombre de cases à utiliser dans l’histogramme en utilisant l’argument breaks :
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=15)
Plus vous spécifiez de catégories, plus vous pourrez obtenir un aperçu granulaire de vos données. À l’inverse, moins vous spécifiez de catégories, plus les données deviendront agrégées :
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=3)
Connexe : utilisez la règle de Sturges pour identifier le nombre optimal de groupes à utiliser dans un histogramme.