La guida completa: come riportare i risultati della regressione logistica
La regressione logistica è un tipo di analisi di regressione che utilizziamo quando la variabile di risposta è binaria.
Possiamo utilizzare il seguente formato generale per riportare i risultati di un modello di regressione logistica:
La regressione logistica è stata utilizzata per analizzare la relazione tra [variabile predittore 1], [variabile predittore 2],…[variabile predittore n ] e [variabile risposta].
Si è scoperto che, mantenendo costanti tutte le altre variabili predittive, la probabilità che [variabile di risposta] si verifichi [aumenta o diminuisce] di [una piccola percentuale] (IC al 95% [limite inferiore, limite superiore]) per un aumento di un’unità in [variabile predittiva 1].
Si è scoperto che, mantenendo costanti tutte le altre variabili predittive, la probabilità che [variabile di risposta] si verifichi [aumenta o diminuisce] di [una piccola percentuale] (IC al 95% [limite inferiore, limite superiore]) per un aumento di un’unità in [variabile predittiva 2].
…
Possiamo utilizzare questa sintassi di base per riportare i rapporti odd e il corrispondente intervallo di confidenza al 95% per i rapporti odd di ciascuna variabile predittiva nel modello.
L’esempio seguente mostra come riportare nella pratica i risultati di un modello di regressione logistica.
Esempio: reporting dei risultati della regressione logistica
Supponiamo che un professore voglia capire se due diversi programmi di studio (Programma A e Programma B) e il numero di ore studiate influiscono sulla probabilità che uno studente superi l’esame finale della sua classe.
Si adatta a un modello di regressione logistica che utilizza le ore di studio e il programma di studio come variabili predittive e il risultato dell’esame (superato o fallito) come variabile di risposta.
Il seguente output mostra i risultati del modello di regressione logistica:
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.415 0.623 -3.876 <0.000 program_A 0.344 0.156 2.205 0.027 hours 0.006 0.002 3.000 0.003
Prima di riportare i risultati del modello di regressione logistica, dobbiamo prima calcolare l’odds ratio per ciascuna variabile predittrice utilizzando la formula e β .
Ad esempio, ecco come calcolare il rapporto odd per ciascuna variabile predittrice:
- Odds ratio del programma: e 0,344 = 1,41
- Odds ratio delle ore: e 0,006 = 1,006
Dobbiamo anche calcolare l’intervallo di confidenza al 95% per l’odds ratio di ciascuna variabile predittrice utilizzando la formula e (β +/- 1,96*errore standard) .
Ad esempio, ecco come calcolare il rapporto odd per ciascuna variabile predittrice:
- IC al 95% per l’odds ratio del programma: e 0,344 +/- 1,96*0,156 = [1,04, 1,92]
- IC al 95% per odds ratio di ore: e 0,006 +/- 1,96*0,002 = [1,002, 1,009]
Ora che abbiamo calcolato l’odds ratio e il corrispondente intervallo di confidenza per ciascuna variabile predittiva, possiamo riportare i risultati del modello come segue:
Per analizzare la relazione tra curriculum e ore studiate sulla probabilità di superare un esame finale è stata utilizzata la regressione logistica.
È stato riscontrato che, mantenendo costante il numero di ore di studio, le probabilità di superare l’esame finale aumentavano del 41% (95% CI [0,04, 0,92]) per gli studenti che utilizzavano il programma di studio A rispetto al programma di studio B.
È stato inoltre riscontrato che, mantenendo costante il programma di studio, le probabilità di superare l’esame finale aumentavano dello 0,6% (95% CI [0,002, 0,009]) per ogni ora studiata in più.
Si noti che abbiamo riportato i rapporti di probabilità per le variabili predittive rispetto ai valori beta del modello perché i rapporti di probabilità sono più facili da interpretare e comprendere.
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sulla regressione logistica:
Introduzione alla regressione logistica
Come eseguire la regressione logistica in R
Come eseguire la regressione logistica in Python
4 esempi di utilizzo della regressione logistica nella vita reale