Excel: come interpretare i valori p nell'output della regressione
La regressione lineare multipla viene utilizzata per quantificare la relazione tra due o più variabili predittive e una variabile di risposta .
Ogni volta che eseguiamo una regressione lineare multipla, siamo sempre interessati ai valori p nel risultato per determinare se la relazione tra le variabili predittive e la variabile di risposta è statisticamente significativa.
Questo tutorial spiega come interpretare i valori p nell’output di un modello di regressione lineare multipla in Excel.
Esempio: interpretazione dei valori P nell’output della regressione in Excel
Supponiamo di voler sapere se il numero di ore trascorse a studiare e il numero di esami preparatori sostenuti influiscono sul voto che uno studente ottiene in un determinato esame di ammissione all’università.
Per esplorare questa relazione, possiamo eseguire una regressione lineare multipla utilizzando le ore studiate e gli esami preparatori presi come variabili predittive e i punteggi degli esami come variabile di risposta.
La schermata seguente mostra l’output della regressione di questo modello in Excel:
Ci sono tre valori p che dovremmo considerare nel risultato:
- Valore P del modello complessivo
- Valore P della prima variabile predittiva (ore)
- Valore P della seconda variabile predittrice (esami preparatori)
Ecco come interpretare ciascun valore p:
Valore P del modello complessivo
Il valore p per il modello complessivo può essere trovato nella colonna denominata F Significatività nel risultato.
Possiamo vedere che questo valore p è 0.00 .
Poiché questo valore è inferiore a 0,05, possiamo concludere che il modello di regressione nel suo complesso è statisticamente significativo.
In altre parole, la combinazione delle ore studiate e degli esami preparatori sostenuti ha una relazione statisticamente significativa con il voto dell’esame finale.
Valore P della prima variabile predittiva (ore)
Il valore p per la prima variabile predittore, ore, è 0,00.
Poiché questo valore è inferiore a 0,05, possiamo concludere che le ore studiate sono statisticamente significative.
In altre parole, il numero di ore di studio di uno studente ha una relazione statisticamente significativa con il voto dell’esame finale.
Valore P della seconda variabile predittrice (esami preparatori)
Il valore p per la seconda variabile predittiva, esami preparatori, è 0,52.
Poiché questo valore non è inferiore a 0,05, possiamo concludere che il numero di esami preparatori sostenuti non è statisticamente significativo.
In altre parole, il numero di esami preparatori sostenuti da uno studente non ha una relazione statisticamente significativa con il voto ottenuto nell’esame finale.
Poiché questa variabile non è statisticamente significativa, possiamo decidere di rimuoverla dal modello in quanto non fornisce alcun miglioramento significativo al modello complessivo.
In questo caso, potremmo eseguire una semplice regressione lineare utilizzando solo le ore studiate come variabile predittiva.
Risorse addizionali
I seguenti tutorial spiegano come eseguire altre attività comuni in Excel:
Come eseguire una regressione lineare semplice in Excel
Come eseguire una regressione lineare multipla in Excel
Come eseguire la regressione polinomiale in Excel