Come eseguire la regressione logistica in stata


La regressione logistica è un metodo che utilizziamo per adattare un modello di regressione quando la variabile di risposta è binaria. Ecco alcuni esempi di utilizzo della regressione logistica:

  • Vogliamo sapere in che modo l’esercizio fisico, la dieta e il peso influiscono sulla probabilità di avere un infarto. La variabile di risposta è l’infarto e ha due esiti potenziali: si verifica un infarto oppure non si verifica.
  • Vogliamo sapere in che modo GPA, punteggio ACT e numero di corsi AP seguiti influiscono sulla probabilità di essere accettati in una particolare università. La variabile di risposta è l’accettazione e ha due potenziali esiti: accettato o non accettato.
  • Vogliamo sapere se il conteggio delle parole e il titolo dell’e-mail influiscono sulla probabilità che un’e-mail sia spam. La variabile di risposta è spam e ha due possibili esiti: spam o non spam.

Questo tutorial spiega come eseguire la regressione logistica in Stata.

Esempio: regressione logistica in Stata

Supponiamo di voler capire se l’età della madre e l’abitudine al fumo influiscono sulla probabilità di avere un bambino con basso peso alla nascita.

Per esplorare questo aspetto, possiamo eseguire una regressione logistica utilizzando l’età e il fumo (sì o no) come variabili esplicative e il basso peso alla nascita (sì o no) come variabile di risposta. Poiché la variabile di risposta è binaria – ci sono solo due possibili risultati – dovrebbe essere utilizzata la regressione logistica.

Completa i seguenti passaggi in Stata per eseguire la regressione logistica utilizzando il set di dati chiamato lbw , che contiene dati su 189 madri diverse.

Passaggio 1: caricare i dati.

Caricare i dati digitando quanto segue nella casella di comando:

utilizzare https://www.stata-press.com/data/r13/lbw

Passaggio 2: ottieni un riepilogo dei dati.

Ottieni una rapida comprensione dei dati con cui stai lavorando digitando quanto segue nella casella di comando:

riassumere

Dataset per basso peso alla nascita in Stata

Possiamo vedere che ci sono 11 variabili diverse nel set di dati, ma le uniche tre che ci interessano sono:

  • basso – se il bambino ha o meno un basso peso alla nascita. 1 = sì, 0 = no.
  • età – età della madre.
  • fumo – se la madre ha fumato o meno durante la gravidanza. 1 = sì, 0 = no.

Passaggio 3: eseguire la regressione logistica.

Digitare quanto segue nella casella di comando per eseguire una regressione logistica utilizzando età e fumo come variabili esplicative e basso come variabile di risposta.

logit di fumo di bassa età

Output della regressione logistica in Stata

Ecco come interpretare i numeri più interessanti nel risultato:

Coef (età): -.0497792. Mantenendo costante il fumo , ogni anno di aumento dell’età è associato a un aumento exp(-0,0497792) = 0,951 delle probabilità che un bambino abbia un basso peso alla nascita. Se questo numero è inferiore a 1, l’aumento dell’età è effettivamente associato a una diminuzione della possibilità di avere un bambino con basso peso alla nascita.

Ad esempio, supponiamo che la madre A e la madre B fumano entrambe. Se la madre A ha un anno in più della madre B, allora le probabilità che la madre A abbia un bambino con basso peso alla nascita sono solo il 95,1% delle probabilità che la madre B abbia un bambino con basso peso alla nascita. la nascita.

P>|z| (età): 0,119. Questo è il valore p associato alla statistica del test per l’età . Poiché questo valore non è inferiore a 0,05, l’età non è un predittore statisticamente significativo del basso peso alla nascita.

Rapporto di probabilità (fumo): 0,6918486. Tenendo costante l’età , una madre che fuma durante la gravidanza ha una probabilità maggiore (0,6918486) = 1,997 di avere un bambino con basso peso alla nascita rispetto a una madre che non fuma durante la gravidanza.

Ad esempio, supponiamo che la madre A e la madre B abbiano entrambe 30 anni. Se la madre A fuma durante la gravidanza e la madre B non fuma, le probabilità che la madre A abbia un bambino con basso peso alla nascita sono superiori del 99,7% rispetto alle probabilità che la madre B abbia un bambino con basso peso alla nascita.

P>|z| (fumo): 0,032. Questo è il valore p associato alla statistica del test per il fumo . Poiché questo valore è inferiore a 0,05, il fumo è un predittore statisticamente significativo di basso peso alla nascita.

Passaggio 4: riportare i risultati.

Infine, vorremmo riportare i risultati della nostra regressione logistica. Ecco un esempio di come eseguire questa operazione:

È stata eseguita una regressione logistica per determinare se l’età della madre e l’abitudine al fumo influenzano la probabilità di avere un bambino con basso peso alla nascita. Nell’analisi è stato utilizzato un campione di 189 madri.

I risultati hanno mostrato che esisteva una relazione statisticamente significativa tra fumo e probabilità di basso peso alla nascita (z = 2,15, p = 0,032), mentre non esisteva alcuna relazione statisticamente significativa tra età e probabilità di basso peso alla nascita (z = -1,56 , p = 0,032). 119).

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *