Come testare la multicollinearità in spss


La multicollinearità nell’analisi di regressione si verifica quando due o più variabili predittive sono altamente correlate tra loro, in modo tale da non fornire informazioni univoche o indipendenti nel modello di regressione. Se il grado di correlazione tra le variabili è sufficientemente elevato, ciò può causare problemi durante l’adattamento e l’interpretazione del modello di regressione.

Un modo per rilevare la multicollinearità è utilizzare una metrica nota come fattore di inflazione della varianza (VIF) , che misura la correlazione e la forza della correlazione tra le variabili predittive in un modello di regressione.

Questo tutorial spiega come utilizzare VIF per rilevare la multicollinearità nell’analisi di regressione in SPSS.

Esempio: multicollinearità in SPSS

Supponiamo di avere il seguente set di dati che mostra il punteggio dell’esame di 10 studenti insieme al numero di ore trascorse a studiare, il numero di esami pratici che hanno sostenuto e il voto attuale nel corso:

Vorremmo eseguire una regressione lineare utilizzando score come variabile di risposta e ore , prep_exams e current_grade come variabili predittive, ma vogliamo assicurarci che le tre variabili predittive non siano altamente correlate.

Per determinare se la multicollinearità è un problema, possiamo produrre valori VIF per ciascuna delle variabili predittive.

Per fare ciò, fare clic sulla scheda Analizza , quindi su Regressione , quindi su Lineare :

Nella nuova finestra visualizzata, trascina il punteggio nella casella denominata Dipendente e trascina le tre variabili predittive nella casella denominata Indipendente/i. Quindi fare clic su Statistiche e assicurarsi che la casella sia selezionata accanto a Diagnostica collinearità . Quindi fare clic su Continua . Quindi fare clic su OK .

Dopo aver fatto clic su OK , viene visualizzata la tabella seguente che mostra il valore VIF per ciascuna variabile predittore:

VIF nell'SPSS

I valori VIF per ciascuna delle variabili predittive sono i seguenti:

  • ore: 1.169
  • esami_di_preparazione: 1.403
  • punteggio_attuale: 1.522

Il valore VIF inizia da 1 e non ha un limite superiore. Una regola generale per interpretare i VIF è:

  • Un valore pari a 1 indica che non esiste alcuna correlazione tra una determinata variabile predittore e qualsiasi altra variabile predittore nel modello.
  • Un valore compreso tra 1 e 5 indica una correlazione moderata tra una determinata variabile predittiva e altre variabili predittive nel modello, ma spesso non è abbastanza grave da richiedere un’attenzione speciale.
  • Un valore maggiore di 5 indica una correlazione potenzialmente seria tra una determinata variabile predittiva e altre variabili predittive nel modello. In questo caso, le stime dei coefficienti e i valori p nei risultati della regressione sono probabilmente inaffidabili.

Possiamo vedere che nessuno dei valori VIF per le variabili predittive in questo esempio è maggiore di 5, indicando che la multicollinearità non sarà un problema nel modello di regressione.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *