Dot plot e istogramma: qual è la differenza?
Due grafici comunemente usati per visualizzare la distribuzione dei valori in un set di dati sono i dot plot e gli istogrammi .
Un diagramma a punti mostra i singoli valori dei dati lungo l’asse x e utilizza i punti per rappresentare le frequenze di ciascun singolo valore.
Un istogramma visualizza gli intervalli di dati lungo l’asse x e utilizza barre rettangolari per rappresentare le frequenze dei valori appartenenti a ciascun intervallo.
L’esempio seguente mostra come creare un dot plot e un istogramma per lo stesso set di dati.
Esempio: creazione di un diagramma a punti e di un istogramma per lo stesso set di dati
Supponiamo di avere il seguente set di dati con 18 valori:
Dati: 1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10
Ecco come apparirebbe un diagramma a punti per questo set di dati:
L’asse x mostra i singoli valori dei dati e l’asse y mostra la frequenza di ciascun valore.
Ad esempio, possiamo vedere che il valore “2” appare tre volte nel set di dati perché ci sono tre punti sopra di esso. Allo stesso modo, possiamo vedere che il valore “3” appare solo una volta perché sopra di esso c’è solo un punto.
Ed ecco come apparirebbe un istogramma per questo set di dati:
L’ordinato.
Ad esempio, possiamo vedere che sette valori sono compresi tra 0 e 2, due valori sono compresi tra 2 e 4 e così via.
Bonus : per coloro che sono curiosi, abbiamo utilizzato il seguente codice R per creare il dot plot e l’istogramma mostrati sopra:
#define dataset data <- c(1, 1, 1, 1, 2, 2, 2, 3, 4, 5, 5, 6, 6, 6, 6, 7, 8, 10) #create dot plot stripchart(data, method = "stack", offset = .5, at = 0, pch = 19, cex=5, col = "steelblue", main = "Dot Plot", xlab = "Data Values", ylab="Frequency") #create histogram hist(data, col='steelblue', main='Histogram', xlab='Data Values')
Dot plot o istogramma: quale dovresti usare?
Come accennato in precedenza, è possibile utilizzare un dot plot e un istogramma per visualizzare la distribuzione dei valori in un set di dati.
Come regola generale, di solito utilizziamo i dot-plot quando il nostro set di dati è piccolo perché ci consente di vedere esattamente quante volte appare ogni singolo valore.
Al contrario, in genere utilizziamo gli istogrammi quando il nostro set di dati è di grandi dimensioni perché è noioso creare un punto per rappresentare ogni singolo valore in un set di dati di grandi dimensioni.
Tieni presente che l’unico svantaggio dell’utilizzo di un istogramma è che non possiamo dire esattamente quante volte appare ogni singolo valore.
Ad esempio, nell’istogramma precedente abbiamo visto che sette valori erano compresi tra 0 e 2, ma non sappiamo esattamente quanti valori fossero 1 e quanti valori fossero 2.
Se vogliamo solo comprendere la “forma” generale di una distribuzione, generalmente non importa se non conosciamo i singoli valori di un set di dati.
Tieni inoltre presente che non possiamo calcolare la mediana o la media esatta semplicemente guardando un istogramma, perché non conosciamo i singoli valori.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sugli istogrammi:
Come stimare gli istogrammi media e mediana
Come descrivere la forma degli istogrammi
Come creare istogrammi in R
Come creare un istogramma in Python
Le seguenti esercitazioni forniscono informazioni aggiuntive sui grafici dei punti:
Come trovare il centro e la diffusione di un dot plot
Come creare un diagramma di punti in Fogli Google
Come creare un diagramma a punti in Excel
Come creare un diagramma a punti in R