Comment créer un histogramme de fréquence relative dans R
Un histogramme de fréquence relative est un graphique qui affiche les fréquences relatives des valeurs dans un ensemble de données.
Ce tutoriel explique comment créer un histogramme de fréquence relative dans R en utilisant la fonction histogram() du lattice , qui utilise la syntaxe suivante :
histogramme (x, type)
où:
- x : données
 - type : type d’histogramme de fréquence relative que vous souhaitez créer ; les options incluent le pourcentage, le nombre et la densité.
 
Histogramme par défaut
Tout d’abord, chargez le package lattice :
library(lattice)
Par défaut, ce package crée un histogramme de fréquence relative avec un pourcentage le long de l’axe y :
#create data data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14) #create relative frequency histogram histogram(data)

Modification de l’histogramme
Nous pouvons modifier l’histogramme pour inclure un titre, différentes étiquettes d’axes et une couleur différente en utilisant les arguments suivants :
- principal : le titre
 - xlab : l’étiquette de l’axe des x
 - ylab : l’étiquette de l’axe y
 - col : la couleur de remplissage à utiliser dans l’histogramme
 
Par exemple:
#modify the histogram
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue')

Modification du nombre de bacs
Nous pouvons spécifier le nombre de cases à utiliser dans l’histogramme en utilisant l’argument breaks :
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=15)

Plus vous spécifiez de catégories, plus vous pourrez obtenir un aperçu granulaire de vos données. À l’inverse, moins vous spécifiez de catégories, plus les données deviendront agrégées :
#modify the number of bins histogram(data, main='Points per Game by Player', xlab='Points per Game', col='steelblue', breaks=3)

Connexe : utilisez la règle de Sturges pour identifier le nombre optimal de groupes à utiliser dans un histogramme.
