Come utilizzare i grafici qq per verificare la normalità
Un grafico QQ, abbreviazione di “quantile-quantile”, viene utilizzato per valutare se un set di dati proviene potenzialmente da una distribuzione teorica.
Nella maggior parte dei casi, questo tipo di grafico viene utilizzato per determinare se un set di dati segue o meno una distribuzione normale.
Se i dati sono distribuiti normalmente, i punti su un grafico QQ giacciono su una linea diagonale retta.
Al contrario, quanto più i punti sul grafico si discostano da una linea diagonale retta, tanto meno è probabile che il set di dati segua una distribuzione normale.
Gli esempi seguenti mostrano come creare grafici QQ in R per verificare la normalità.
Esempio 1: grafico QQ per dati normali
Il codice seguente mostra come generare un set di dati distribuito normalmente con 200 osservazioni e creare un grafico QQ per il set di dati in R:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create QQ plot qqnorm(data) qqline(data)
Possiamo vedere che i punti giacciono principalmente lungo la linea diagonale retta con alcune deviazioni minori lungo ciascuna delle code.
Sulla base di questo grafico, possiamo tranquillamente supporre che questo set di dati sia distribuito normalmente.
Esempio 2: grafico QQ per dati non normali
Il codice seguente mostra come creare un grafico QQ per un set di dati che segue una distribuzione esponenziale con 200 osservazioni:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create QQ plot qqnorm(data) qqline(data)
Vediamo che i punti si discostano notevolmente dalla linea diagonale. Ciò indica chiaramente che il set di dati non è distribuito normalmente.
Ciò dovrebbe avere senso dato che abbiamo specificato che i dati dovrebbero seguire una distribuzione esponenziale.
Grafici e istogrammi QQ
Va notato che i grafici QQ sono un modo per verificare visivamente se un set di dati segue o meno una distribuzione normale.
Un altro modo per verificare visivamente la normalità è creare un istogramma del set di dati. Se i dati seguono approssimativamente la forma di una curva a campana nell’istogramma, allora possiamo supporre che il set di dati sia distribuito normalmente.
Ad esempio, ecco come creare un istogramma per il set di dati precedentemente distribuito normalmente:
#make this example reproducible set. seeds (1) #create some fake data that follows a normal distribution data <- rnorm(200) #create a histogram to visualize the distribution hist(data)
Ed ecco come creare un istogramma per il set di dati che segue una distribuzione a priori esponenziale:
#make this example reproducible set. seeds (1) #create some fake data that follows an exponential distribution data <- rexp(200, rate=3) #create a histogram to visualize the distribution hist(data)
Vediamo che l’istogramma non assomiglia affatto ad una curva a campana, il che indica chiaramente che i dati non seguono una distribuzione normale.
Risorse addizionali
Qual è il presupposto di normalità in statistica?
Come creare un grafico QQ in R
Come creare un grafico QQ in Excel
Come creare un grafico QQ in Python