A: come modificare il numero di contenitori nell'istogramma
Quando crei un istogramma in R, viene utilizzata una formula nota come regola di Sturges per determinare il numero ottimale di gruppi da utilizzare.
Tuttavia, puoi utilizzare la seguente sintassi per sovrascrivere questa formula e specificare un numero esatto di gruppi da utilizzare nell’istogramma:
hist(data, breaks = seq(min(data), max(data), length. out = 7 ))
Tieni presente che il numero di gruppi utilizzati nell’istogramma sarà uno in meno rispetto al numero specificato nell’argomento length.out .
Gli esempi seguenti mostrano come utilizzare questa sintassi nella pratica.
Esempio 1: creare un istogramma di base
Il codice seguente mostra come creare un istogramma di base in R senza specificare il numero di contenitori:
#define vector of data
data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16)
#create histogram of data
hist(data, col = ' lightblue ')
Utilizzando la regola di Sturges, R ha deciso di utilizzare 8 gruppi in totale nell’istogramma.
Esempio 2: specificare il numero di contenitori da utilizzare nell’istogramma
Il codice seguente mostra come creare un istogramma per lo stesso vettore di dati e utilizzare esattamente 6 gruppi:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 6 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 7 ))
Precauzioni per la scelta di un numero specifico di contenitori
Il numero di gruppi utilizzati in un istogramma ha un enorme impatto sul modo in cui interpretiamo un set di dati.
Se utilizziamo troppo pochi gruppi, il vero modello sottostante nei dati può essere nascosto:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 3 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 4 ))
Al contrario, se utilizziamo troppi gruppi, possiamo semplicemente visualizzare il rumore in un set di dati:
#define vector of data data <- c(1, 2, 2, 3, 4, 4, 4, 5, 5, 6, 7, 10, 11, 13, 16, 16, 16) #create histogram with 15 bins hist(data, col = ' lightblue ', breaks = seq(min(data), max(data), length. out = 16 ))
In generale, la regola Sturges predefinita utilizzata in R tende a produrre istogrammi con un numero ottimale di gruppi.
Sentiti libero di utilizzare il codice fornito qui per creare un istogramma con un numero esatto di contenitori, ma fai attenzione a non sceglierne troppi o troppo pochi.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre funzioni comuni con gli istogrammi in R:
Come tracciare più istogrammi in R
Come creare un istogramma di due variabili in R
Come creare un istogramma di frequenza relativo in R