Hoe om te gaan met r-waarschuwing: stat_bin() met behulp van bins = 30
Een veel voorkomende waarschuwing die u in R kunt tegenkomen is:
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Deze waarschuwing verschijnt wanneer u geom_histogram() gebruikt om een histogram te maken in ggplot2 en u niet in staat bent het aantal groepen op te geven dat u in het histogram wilt gebruiken.
Om deze waarschuwing te vermijden, kunt u het argument bins gebruiken om het aantal te gebruiken bins op te geven:
ggplot(df, aes(x=my_variable)) +
geom_histogram(bins= 10 )
Het volgende voorbeeld laat zien hoe u deze waarschuwing in de praktijk kunt vermijden.
Voorbeeld: hoe u de waarschuwing stat_bins() kunt vermijden door bins = 30 te gebruiken
Stel dat we de functie geom_histogram() van ggplot2 gebruiken om een histogram te maken voor een variabele in een dataframe:
library (ggplot2)
#make this example reproducible
set. seed ( 0 )
#create data frame
df <- data. frame (my_values = rnorm( 1000 ))
#view head of data frame
head(df)
my_values
1 1.2629543
2 -0.3262334
3 1.3297993
4 1.2724293
5 0.4146414
6 -1.5399500
#create histogram
ggplot(df, aes(x=my_values)) +
geom_histogram(col=' black ', fill=' steelblue ')
`stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Merk op dat we de waarschuwing `stat_bin()` ontvangen met behulp van `bins = 30`. Kies een betere waarde met `binwidth`.
Opgemerkt moet worden dat dit slechts een waarschuwing is en dat het histogram nog steeds door ggplot2 wordt gemaakt.
We kunnen deze waarschuwing echter volledig vermijden door het argument bins in geom_histogram() te gebruiken om het aantal bins op te geven dat in het histogram moet worden gebruikt.
We kunnen bijvoorbeeld de volgende code gebruiken om 10 bakken voor het histogram te gebruiken:
#create histogram with 10 bins
ggplot(df, aes(x=my_values)) +
geom_histogram(col=' black ', fill=' steelblue ', bins= 10 )
Houd er rekening mee dat we deze keer geen waarschuwingsberichten krijgen en dat het histogram precies 10 bakken bevat.
Houd er rekening mee dat hoe minder bakken u gebruikt, hoe breder elke bak zal zijn.
We kunnen in plaats daarvan bijvoorbeeld 5 bakken gebruiken:
#create histogram with 5 bins
ggplot(df, aes(x=my_values)) +
geom_histogram(col=' black ', fill=' steelblue ', bins= 5 )
Merk op dat er minder maar grotere groepen in dit histogram zijn.
Voel je vrij om zoveel bakken te gebruiken als je wilt in je histogram.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende fouten in R kunt oplossen:
Oplossing in R: namen komen niet overeen met eerdere namen
Hoe op te lossen in R: NA’s geïntroduceerd door dwang
Hoe te repareren in R: hint buiten de grenzen
Hoe op te lossen in R: contrasten kunnen alleen worden toegepast op factoren met 2 of meer niveaus