Come interpretare i coefficienti di regressione logistica (con esempio)


La regressione logistica è un metodo che possiamo utilizzare per adattare un modello di regressione quando la variabile di risposta è binaria.

Quando adattiamo un modello di regressione logistica, i coefficienti dei risultati del modello rappresentano la variazione media nella probabilità logaritmica della variabile di risposta associata a un aumento di un’unità della variabile predittrice.

 β = Average Change in Log Odds of Response Variable

Spesso vogliamo comprendere la variazione media delle probabilità della variabile di risposta associata a un aumento di un’unità della variabile predittrice, che possiamo trovare utilizzando la formula e β .

 e β = Average Change in Odds of Response Variable

L’esempio seguente mostra come interpretare nella pratica i coefficienti di regressione logistica.

Esempio: come interpretare i coefficienti di regressione logistica

Supponiamo di voler adattare un modello di regressione logistica utilizzando il genere e il numero di esami pratici sostenuti per prevedere se uno studente supererà o meno un esame finale in una classe.

Supponiamo di adattare il modello utilizzando un software statistico (come R,Python , Excel o SAS ) e di ricevere il seguente risultato:

Stima del coefficiente Errore standard Valore Z Valore P
Intercettare -1.34 0,23 5.83 <0,001
Genere maschile) -0,56 0,25 2.24 0,03
Esami pratici 1.13 0,43 2.63 0,01

Come interpretare il genere (variabile predittrice binaria)

Possiamo vedere che la stima del coefficiente per il genere è negativa, indicando che essere maschio diminuisce le possibilità di superare l’esame.

Possiamo anche vedere che il valore p per il genere è inferiore a 0,05, il che significa che ha un effetto statisticamente significativo sul superamento o meno dell’esame da parte di un individuo.

Per capire esattamente come l’essere maschio incide sul superamento o meno dell’esame, possiamo utilizzare la formula e β .

e -0,56 = 0,57

Interpretiamo ciò nel senso che gli uomini hanno solo 0,57 volte più probabilità delle donne di superare l’esame, assumendo che il numero di esami pratici rimanga costante .

Potremmo anche dire che gli uomini hanno (1 – 0,57) il 43% in meno di probabilità di superare l’esame rispetto alle donne, sempre assumendo che il numero di esami pratici rimanga costante .

Come interpretare le prove pratiche (variabile predittiva continua)

Possiamo vedere che la stima del coefficiente per le prove pratiche è positiva, indicando che ogni prova pratica aggiuntiva sostenuta aumenta la possibilità di superare l’esame finale.

Possiamo anche vedere che il valore p per il numero di esami pratici sostenuti è inferiore a 0,05, il che significa che ha un effetto statisticamente significativo sul superamento o meno dell’esame finale da parte di un individuo.

Per quantificare l’impatto di ogni esame pratico aggiuntivo sul superamento o meno dell’esame finale da parte di un individuo, possiamo utilizzare la formula e β .

e 1,13 = 3,09

Interpretiamo questo nel senso che ogni esame pratico aggiuntivo sostenuto aumenta la possibilità di superare l’esame finale del 3,09 , assumendo che il genere rimanga costante .

Potremmo anche dire che ogni ulteriore esame pratico sostenuto è associato ad un aumento (3,09 – 1) del 209% delle probabilità di superare l’esame finale, sempre assumendo che il genere rimanga costante.

Nota : fare riferimento a questo articolo per sapere come interpretare il termine originale in un modello di regressione logistica.

Risorse addizionali

Le seguenti esercitazioni forniscono informazioni aggiuntive sulla regressione logistica:

Come riportare i risultati della regressione logistica
Comprendere l’ipotesi nulla per la regressione logistica
La differenza tra regressione logistica e regressione lineare

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *