Comment gérer l’avertissement R : stat_bin() utilisant bins = 30
Un avertissement courant que vous pouvez rencontrer dans R est :
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Cet avertissement apparaît lorsque vous utilisez geom_histogram() pour créer un histogramme dans ggplot2 et que vous ne parvenez pas à spécifier le nombre de groupes à utiliser dans l’histogramme.
Pour éviter cet avertissement, vous pouvez utiliser l’argument bins pour spécifier le nombre de bins à utiliser :
ggplot(df, aes(x=my_variable)) +
geom_histogram(bins=10)
L’exemple suivant montre comment éviter cet avertissement dans la pratique.
Exemple : Comment éviter l’avertissement stat_bins() en utilisant bins = 30
Supposons que nous utilisions la fonction geom_histogram() de ggplot2 pour créer un histogramme pour une variable dans un bloc de données :
library(ggplot2)
#make this example reproducible
set.seed(0)
#create data frame
df <- data.frame(my_values = rnorm(1000))
#view head of data frame
head(df)
my_values
1 1.2629543
2 -0.3262334
3 1.3297993
4 1.2724293
5 0.4146414
6 -1.5399500
#create histogram
ggplot(df, aes(x=my_values)) +
geom_histogram(col='black', fill='steelblue')
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Notez que nous recevons l’avertissement `stat_bin()` en utilisant `bins = 30`. Choisissez une meilleure valeur avec `binwidth`.
Il convient de noter qu’il ne s’agit que d’un avertissement et que l’histogramme est toujours créé par ggplot2.
Cependant, nous pouvons éviter complètement cet avertissement en utilisant l’argument bins dans geom_histogram() pour spécifier le nombre de groupes à utiliser dans l’histogramme.
Par exemple, nous pouvons utiliser le code suivant pour utiliser 10 bins pour l’histogramme :
#create histogram with 10 bins
ggplot(df, aes(x=my_values)) +
geom_histogram(col='black', fill='steelblue', bins=10)
Notez que nous ne recevons aucun message d’avertissement cette fois et que l’histogramme contient exactement 10 bacs.
Notez que moins vous utilisez de bacs, plus chaque bac sera large.
Par exemple, on pourrait plutôt utiliser 5 bacs :
#create histogram with 5 bins
ggplot(df, aes(x=my_values)) +
geom_histogram(col='black', fill='steelblue', bins=5)
Notez qu’il y a moins de groupes mais plus larges dans cet histogramme.
N’hésitez pas à utiliser autant de bacs que vous le souhaitez dans votre histogramme.
Ressources additionnelles
Les didacticiels suivants expliquent comment résoudre d’autres erreurs courantes dans R :
Comment réparer dans R : les noms ne correspondent pas aux noms précédents
Comment réparer dans R : les NA introduits par la coercition
Comment réparer dans R : indice hors limites
Comment réparer dans R : les contrastes ne peuvent être appliqués qu’à des facteurs avec 2 niveaux ou plus