Come impostare il numero di contenitori per un istogramma in ggplot2


Puoi utilizzare l’argomento bins per specificare il numero di bin da utilizzare in un istogramma in ggplot2 :

 library (ggplot2)

ggplot(df, aes (x=x)) +
  geom_histogram(bins= 10 )

Gli esempi seguenti mostrano come utilizzare questo argomento nella pratica.

Esempio: imposta il numero di contenitori per l’istogramma in ggplot2

Il codice seguente mostra come creare un set di dati in R contenente 10.000 valori casuali che seguono una distribuzione di Poisson con un valore medio pari a 2:

 #make this example reproducible
set. seeds (0)

#create data frame with 10,000 random values that follow Poisson distribution
df <- data. frame (values=rpois(n= 10000 , lambda= 2 ))

#view first five rows of data frame
head(df)

  values
1 4
2 1
3 1
4 2
5 4
6 1

Possiamo utilizzare il seguente codice per creare un istogramma in ggplot2 per visualizzare la distribuzione dei valori nel frame di dati:

 library (ggplot2)

ggplot(df, aes (x=values)) +
  geom_histogram(fill=' steelblue ', col=' black ') 

Per impostazione predefinita, ggplot2 selezionerà automaticamente un certo numero di caselle da utilizzare nell’istogramma.

Tuttavia, possiamo utilizzare la seguente sintassi per specificare che vogliamo che l’istogramma utilizzi 10 contenitori:

 library (ggplot2)

ggplot(df, aes (x=values)) +
  geom_histogram(fill=' steelblue ', col=' black ', bins= 10 ) 

Tieni presente che l’istogramma ora ha esattamente 10 riquadri.

Oppure potremmo usare la seguente sintassi per specificare che vogliamo che l’istogramma utilizzi 5 contenitori:

 library (ggplot2)

ggplot(df, aes (x=values)) +
  geom_histogram(fill=' steelblue ', col=' black ', bins= 5 ) 

Tieni presente che l’istogramma ora ha esattamente 5 riquadri.

Scoprirai che meno contenitori utilizzi, più ampio sarà ciascun contenitore.

In generale, se si utilizzano troppo pochi gruppi, la vera distribuzione dei valori sottostante verrà nascosta.

Tuttavia, se utilizzi troppi gruppi, rischi di vedere semplicemente del rumore nei dati.

Un modo per trovare il numero ottimale di contenitori da utilizzare in un istogramma è utilizzare la regola di Sturges . Scopri di più su questa regola qui .

Nota : puoi trovare la documentazione completa per la funzione geom_histogram qui .

Risorse addizionali

I seguenti tutorial spiegano come creare altri grafici comuni in R:

Come creare un istogramma di frequenza relativo in R
Come tracciare più boxplot in un singolo grafico in R
Come tracciare più linee in un grafico in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *