A: come modificare il numero di contenitori nell'istogramma


Quando crei un istogramma in R, viene utilizzata una formula nota come regola di Sturges per determinare il numero ottimale di gruppi da utilizzare.

Tuttavia, puoi utilizzare la seguente sintassi per sovrascrivere questa formula e specificare un numero esatto di gruppi da utilizzare nell’istogramma:

 hist(data, breaks = seq(min(data), max(data), length. out = 7 ))

Tieni presente che il numero di gruppi utilizzati nell’istogramma sarà uno in meno rispetto al numero specificato nell’argomento length.out .

Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.

Esempio 1: creare un istogramma di base

Il codice seguente mostra come creare un istogramma di base in R senza specificare il numero di contenitori:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram of data
hist(data, col = ' lightblue ') 

Utilizzando la regola di Sturges, R ha deciso di utilizzare 8 gruppi in totale nell’istogramma.

Esempio 2: specificare il numero di contenitori da utilizzare nell’istogramma

Il codice seguente mostra come creare un istogramma per lo stesso vettore di dati e utilizzare esattamente 6 gruppi:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 6 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 )) 

Precauzioni per la scelta di un numero specifico di contenitori

Il numero di gruppi utilizzati in un istogramma ha un enorme impatto sul modo in cui interpretiamo un set di dati.

Se utilizziamo troppo pochi gruppi, il vero modello sottostante nei dati può essere nascosto:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 3 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 )) 

Al contrario, se utilizziamo troppi gruppi, possiamo semplicemente visualizzare il rumore in un set di dati:

 #define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)

#create histogram with 15 bins
hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 )) 

In generale, la regola Sturges predefinita utilizzata in R tende a produrre istogrammi con un numero ottimale di gruppi.

Sentiti libero di utilizzare il codice fornito qui per creare un istogramma con un numero esatto di contenitori, ma fai attenzione a non sceglierne troppi o troppo pochi.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre funzioni comuni con gli istogrammi in R:

Come tracciare più istogrammi in R
Come creare un istogramma di due variabili in R
Come creare un istogramma di frequenza relativo in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *