Come interpretare un grafico in scala e posizione: con esempi


Un grafico delle posizioni in scala è un tipo di grafico che mostra i valori adattati di un modello di regressione lungo l’asse x e la radice quadrata dei residui standardizzati lungo l’asse y.

Grafico della posizione in scala

Osservando questo grafico controlliamo due cose:

1. Verificare che la linea rossa sia approssimativamente orizzontale sul grafico. Se questo è il caso, allora è probabile che l’ipotesi di omoschedasticità sia soddisfatta per un dato modello di regressione. Cioè, la distribuzione dei residui è approssimativamente uguale per tutti i valori adattati.

2. Verificare che non vi sia un andamento chiaro tra i residui. In altre parole, i residui dovrebbero essere sparsi in modo casuale attorno alla linea rossa con una variabilità approssimativamente uguale per tutti i valori adattati.

Scala e tracciamento della posizione in R

Possiamo utilizzare il codice seguente per adattare un semplice modello di regressione lineare in R e produrre un grafico di scala e posizione per il modello risultante:

 #fit simple linear regression model
model <- lm(Ozone ~ Temp, data = airquality)

#produce scale-location plot
plot(model)

Grafico della posizione in scala in R

Possiamo osservare le due cose seguenti dal grafico delle posizioni in scala di questo modello di regressione.

1. La linea rossa è approssimativamente orizzontale sul grafico. Se questo è il caso, allora l’ipotesi di omoschedasticità è soddisfatta per un dato modello di regressione. Cioè, la distribuzione dei residui è approssimativamente uguale per tutti i valori adattati.

2. Verificare che non vi sia un andamento chiaro tra i residui. In altre parole, i residui dovrebbero essere sparsi in modo casuale attorno alla linea rossa con una variabilità approssimativamente uguale per tutti i valori adattati.

Note tecniche

Le tre osservazioni del set di dati con i residui standardizzati più elevati sono etichettate nel grafico.

Possiamo vedere che le osservazioni nelle righe 30, 62 e 117 hanno i residui standardizzati più alti.

Ciò non significa necessariamente che queste osservazioni siano valori anomali, ma potresti voler guardare i dati originali per esaminare queste osservazioni più da vicino.

Anche se possiamo vedere che la linea rossa è più o meno orizzontale sul grafico della posizione in scala, questo serve solo come modo visivo per vedere se il presupposto dell’omoschedasticità è soddisfatto.

Un test statistico formale che possiamo utilizzare per vedere se il presupposto dell’omoschedasticità è soddisfatto è il test di Breusch-Pagan .

Test di Breusch-Pagan in R

Il codice seguente mostra come utilizzare la funzione bptest() del pacchetto lmtest per eseguire un test Breusch-Pagan in R:

 #load lmtest package
library(lmtest)

#perform Breusch-Pagan Test
bptest(model)

	studentized Breusch-Pagan test

data: model
BP = 1.4798, df = 1, p-value = 0.2238

Un test di Breusch-Pagan utilizza le seguenti ipotesi nulle e alternative:

  • Ipotesi nulla (H 0 ): i residui sono omoschedastici (cioè uniformemente distribuiti)
  • Ipotesi alternativa ( HA ): I residui sono eteroschedastici (cioè non uniformemente distribuiti)

Dal risultato possiamo vedere che il valore p del test è 0,2238 . Poiché questo valore p non è inferiore a 0,05, non riusciamo a rifiutare l’ipotesi nulla. Non abbiamo prove sufficienti per affermare che l’eteroschedasticità sia presente nel modello di regressione.

Questo risultato corrisponde alla nostra ispezione visiva della linea rossa nel grafico della posizione in scala.

Risorse addizionali

Comprendere l’eteroschedasticità nell’analisi di regressione
Come creare una trama residua in R
Come eseguire un test di Breusch-Pagan in R

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *