Comment créer un histogramme de fréquence relative dans R



Un histogramme de fréquence relative est un graphique qui affiche les fréquences relatives des valeurs dans un ensemble de données.

Ce tutoriel explique comment créer un histogramme de fréquence relative dans R en utilisant la fonction histogram() du lattice , qui utilise la syntaxe suivante :

histogramme (x, type)

où:

  • x : données
  • type : type d’histogramme de fréquence relative que vous souhaitez créer ; les options incluent le pourcentage, le nombre et la densité.

Histogramme par défaut

Tout d’abord, chargez le package lattice :

library(lattice)

Par défaut, ce package crée un histogramme de fréquence relative avec un pourcentage le long de l’axe y :

#create data
data <- c(0, 0, 2, 3, 4, 4, 5, 6, 7, 12, 12, 14)

#create relative frequency histogram
histogram(data)

Histogramme de fréquence relative dans R

Modification de l’histogramme

Nous pouvons modifier l’histogramme pour inclure un titre, différentes étiquettes d’axes et une couleur différente en utilisant les arguments suivants :

  • principal : le titre
  • xlab : l’étiquette de l’axe des x
  • ylab : l’étiquette de l’axe y
  • col : la couleur de remplissage à utiliser dans l’histogramme

Par exemple:

#modify the histogram
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue')

Histogramme de fréquence relative dans R utilisant le package de treillis

Modification du nombre de bacs

Nous pouvons spécifier le nombre de cases à utiliser dans l’histogramme en utilisant l’argument breaks :

#modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=15)

Histogramme de fréquence relative avec bacs ajustés dans R

Plus vous spécifiez de catégories, plus vous pourrez obtenir un aperçu granulaire de vos données. À l’inverse, moins vous spécifiez de catégories, plus les données deviendront agrégées :

#modify the number of bins
histogram(data,
          main='Points per Game by Player',
          xlab='Points per Game',
          col='steelblue',
          breaks=3)

Histogramme de fréquence relative dans R

Connexe : utilisez la règle de Sturges pour identifier le nombre optimal de groupes à utiliser dans un histogramme.

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *