Come eseguire la regressione lineare multipla in spss


La regressione lineare multipla è un metodo che possiamo utilizzare per comprendere la relazione tra due o più variabili esplicative e una variabile di risposta.

Questo tutorial spiega come eseguire la regressione lineare multipla in SPSS.

Esempio: regressione lineare multipla in SPSS

Supponiamo di voler sapere se il numero di ore trascorse a studiare e il numero di esami pratici sostenuti influiscono sul voto che uno studente riceve in un determinato esame. Per esplorare questo, possiamo eseguire una regressione lineare multipla utilizzando le seguenti variabili:

Variabili esplicative:

  • Ore studiate
  • Esami preparatori superati

Variabile di risposta:

  • Risultato dell’esame

Utilizzare i passaggi seguenti per eseguire questa regressione lineare multipla in SPSS.

Passaggio 1: inserisci i dati.

Inserire i seguenti dati relativi al numero di ore studiate, esami preparatori sostenuti e risultati esami ricevuti per 20 studenti:

Passaggio 2: eseguire la regressione lineare multipla.

Fare clic sulla scheda Analizza , quindi su Regressione e infine su Lineare :

Regressione lineare multipla in SPSS

Trascina il punteggio variabile nella casella denominata Dipendente. Trascina le variabili ore e prep_exams nella casella denominata Indipendente/i. Quindi fare clic su OK .

Esempio di regressione lineare multipla in SPSS

Passaggio 3: interpretare il risultato.

Dopo aver fatto clic su OK , i risultati della regressione lineare multipla verranno visualizzati in una nuova finestra.

La prima tabella che ci interessa si chiama Model Summary :

Risultato riassuntivo del modello di regressione in SPSS

Ecco come interpretare i numeri più rilevanti in questa tabella:

  • R quadrato: questa è la proporzione della varianza nella variabile di risposta che può essere spiegata dalle variabili esplicative. In questo esempio, il 73,4% della variazione dei punteggi degli esami può essere spiegata dalle ore studiate e dal numero di esami preparatori sostenuti.
  • Standard. Errore di stima: l’errore standard è la distanza media tra i valori osservati e la retta di regressione. In questo esempio i valori osservati si discostano in media di 5.3657 unità dalla retta di regressione.

La prossima tabella che ci interessa si chiama ANOVA :

Tabella di output ANOVA per la regressione in SPSS

Ecco come interpretare i numeri più rilevanti in questa tabella:

  • F: questa è la statistica F complessiva per il modello di regressione, calcolata come regressione quadrata media/residuo quadrato medio.
  • Sig: questo è il valore p associato alla statistica F complessiva. Questo ci dice se il modello di regressione nel suo insieme è statisticamente significativo o meno. In altre parole, ci dice se le due variabili esplicative combinate hanno un’associazione statisticamente significativa con la variabile di risposta. In questo caso il p-value è pari a 0,000, il che indica che le variabili esplicative, ore studiate ed esami preparatori sostenuti, hanno un’associazione statisticamente significativa con il risultato dell’esame.

La seguente tabella che ci interessa si intitola Coefficienti :

Output del coefficiente di regressione lineare multipla in SPSS

Ecco come interpretare i numeri più rilevanti in questa tabella:

  • B non standardizzato (costante): ci dice il valore medio della variabile di risposta quando entrambe le variabili predittive sono zero. In questo esempio, il punteggio medio dell’esame è 67.674 quando le ore studiate e gli esami preparatori sostenuti sono entrambi pari a zero.
  • B (ore) non standardizzato: indica la variazione media dei punteggi degli esami associata a un aumento di un’unità delle ore di studio, presupponendo che il numero di esami preparatori sostenuti rimanga costante. In questo caso, ogni ora aggiuntiva dedicata allo studio è associata a un aumento di 5.556 punti nel punteggio dell’esame, assumendo che il numero di esami pratici sostenuti rimanga costante.
  • B non standardizzato (prep_exams): indica la variazione media del punteggio dell’esame associata a un aumento di un’unità degli esami preparatori sostenuti, presupponendo che il numero di ore studiate rimanga costante. In questo caso, ad ogni ulteriore esame preparatorio sostenuto è associata una diminuzione di 0,602 punti nel punteggio dell’esame, assumendo che il numero di ore studiate rimanga costante.
  • Sig. (ore): questo è il valore p per la variabile esplicativa ore . Poiché questo valore (0,000) è inferiore a 0,05, possiamo concludere che le ore studiate hanno un’associazione statisticamente significativa con i punteggi degli esami.
  • Sig. (prep_exams): questo è il valore p per la variabile esplicativa prep_exams . Poiché questo valore (0,519) non è inferiore a 0,05, non possiamo concludere che il numero di esami preparatori sostenuti abbia un’associazione statisticamente significativa con il risultato dell’esame.

Infine, possiamo formare un’equazione di regressione utilizzando i valori mostrati nella tabella per costante , ore e prep_exams . In questo caso l’equazione sarebbe:

Punteggio esame stimato = 67.674 + 5.556*(ore) – 0.602*(prep_exams)

Possiamo utilizzare questa equazione per trovare il punteggio stimato dell’esame di uno studente, in base al numero di ore di studio e al numero di esami pratici che ha sostenuto. Ad esempio, uno studente che studia per 3 ore e sostiene 2 esami preparatori dovrebbe ricevere un punteggio dell’esame di 83,1:

Punteggio esame stimato = 67,674 + 5,556*(3) – 0,602*(2) = 83,1

Nota: poiché la variabile esplicativa per gli esami preparatori non è risultata statisticamente significativa, possiamo decidere di rimuoverla dal modello ed eseguire invece una semplice regressione lineare utilizzando le ore studiate come unica variabile esplicativa.

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *