Come interpretare i coefficienti di regressione logistica (con esempio)
La regressione logistica è un metodo che possiamo utilizzare per adattare un modello di regressione quando la variabile di risposta è binaria.
Quando adattiamo un modello di regressione logistica, i coefficienti dei risultati del modello rappresentano la variazione media nella probabilità logaritmica della variabile di risposta associata a un aumento di un’unità della variabile predittrice.
β = Average Change in Log Odds of Response Variable
Spesso vogliamo comprendere la variazione media delle probabilità della variabile di risposta associata a un aumento di un’unità della variabile predittrice, che possiamo trovare utilizzando la formula e β .
e β = Average Change in Odds of Response Variable
L’esempio seguente mostra come interpretare nella pratica i coefficienti di regressione logistica.
Esempio: come interpretare i coefficienti di regressione logistica
Supponiamo di voler adattare un modello di regressione logistica utilizzando il genere e il numero di esami pratici sostenuti per prevedere se uno studente supererà o meno un esame finale in una classe.
Supponiamo di adattare il modello utilizzando un software statistico (come R,Python , Excel o SAS ) e di ricevere il seguente risultato:
Stima del coefficiente | Errore standard | Valore Z | Valore P | |
---|---|---|---|---|
Intercettare | -1.34 | 0,23 | 5.83 | <0,001 |
Genere maschile) | -0,56 | 0,25 | 2.24 | 0,03 |
Esami pratici | 1.13 | 0,43 | 2.63 | 0,01 |
Come interpretare il genere (variabile predittrice binaria)
Possiamo vedere che la stima del coefficiente per il genere è negativa, indicando che essere maschio diminuisce le possibilità di superare l’esame.
Possiamo anche vedere che il valore p per il genere è inferiore a 0,05, il che significa che ha un effetto statisticamente significativo sul superamento o meno dell’esame da parte di un individuo.
Per capire esattamente come l’essere maschio incide sul superamento o meno dell’esame, possiamo utilizzare la formula e β .
e -0,56 = 0,57
Interpretiamo ciò nel senso che gli uomini hanno solo 0,57 volte più probabilità delle donne di superare l’esame, assumendo che il numero di esami pratici rimanga costante .
Potremmo anche dire che gli uomini hanno (1 – 0,57) il 43% in meno di probabilità di superare l’esame rispetto alle donne, sempre assumendo che il numero di esami pratici rimanga costante .
Come interpretare le prove pratiche (variabile predittiva continua)
Possiamo vedere che la stima del coefficiente per le prove pratiche è positiva, indicando che ogni prova pratica aggiuntiva sostenuta aumenta la possibilità di superare l’esame finale.
Possiamo anche vedere che il valore p per il numero di esami pratici sostenuti è inferiore a 0,05, il che significa che ha un effetto statisticamente significativo sul superamento o meno dell’esame finale da parte di un individuo.
Per quantificare l’impatto di ogni esame pratico aggiuntivo sul superamento o meno dell’esame finale da parte di un individuo, possiamo utilizzare la formula e β .
e 1,13 = 3,09
Interpretiamo questo nel senso che ogni esame pratico aggiuntivo sostenuto aumenta la possibilità di superare l’esame finale del 3,09 , assumendo che il genere rimanga costante .
Potremmo anche dire che ogni ulteriore esame pratico sostenuto è associato ad un aumento (3,09 – 1) del 209% delle probabilità di superare l’esame finale, sempre assumendo che il genere rimanga costante.
Nota : fare riferimento a questo articolo per sapere come interpretare il termine originale in un modello di regressione logistica.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sulla regressione logistica:
Come riportare i risultati della regressione logistica
Comprendere l’ipotesi nulla per la regressione logistica
La differenza tra regressione logistica e regressione lineare