Como realizar regressão logística no stata


A regressão logística é um método que usamos para ajustar um modelo de regressão quando a variável de resposta é binária. Aqui estão alguns exemplos de uso de regressão logística:

  • Queremos saber como o exercício, a dieta e o peso afetam a probabilidade de ter um ataque cardíaco. A variável de resposta é o ataque cardíaco e tem dois resultados potenciais: ocorre ou não ocorre um ataque cardíaco.
  • Queremos saber como o GPA, a pontuação do ACT e o número de cursos AP realizados impactam a probabilidade de ser aceito em uma determinada universidade. A variável resposta é a aceitação e tem dois resultados potenciais: aceito ou não aceito.
  • Queremos saber se a contagem de palavras e o título do e-mail afetam a probabilidade de um e-mail ser spam. A variável de resposta é spam e tem dois resultados potenciais: spam ou não spam.

Este tutorial explica como realizar regressão logística no Stata.

Exemplo: regressão logística no Stata

Suponha que queremos entender se a idade da mãe e os hábitos de fumar afetam a probabilidade de ter um bebê com baixo peso ao nascer.

Para explorar isso, podemos realizar regressão logística usando idade e tabagismo (sim ou não) como variáveis explicativas e baixo peso ao nascer (sim ou não) como variável resposta. Como a variável resposta é binária – existem apenas dois resultados possíveis – a regressão logística deve ser utilizada.

Conclua as etapas a seguir no Stata para realizar a regressão logística usando o conjunto de dados chamado lbw , que contém dados de 189 mães diferentes.

Etapa 1: carregar dados.

Carregue os dados digitando o seguinte na caixa de comando:

use https://www.stata-press.com/data/r13/lbw

Etapa 2: obtenha um resumo dos dados.

Obtenha uma compreensão rápida dos dados com os quais você está trabalhando digitando o seguinte na caixa Comando:

resumir

Conjunto de dados de baixo peso ao nascer no Stata

Podemos ver que existem 11 variáveis diferentes no conjunto de dados, mas as únicas três que nos interessam são:

  • baixo – se o bebê tem ou não baixo peso ao nascer. 1 = sim, 0 = não.
  • idade – idade da mãe.
  • fumaça – se a mãe fumou ou não durante a gravidez. 1 = sim, 0 = não.

Etapa 3: Execute a regressão logística.

Digite o seguinte na caixa de comando para realizar uma regressão logística usando idade e fumo como variáveis explicativas e baixo como variável de resposta.

logit de fumaça de baixa idade

Saída de regressão logística no Stata

Veja como interpretar os números mais interessantes no resultado:

Coef (idade): -0,0497792. Mantendo o fumo constante, cada ano de aumento na idade está associado a um aumento exp(-0,0497792) = 0,951 nas probabilidades de um bebé ter baixo peso ao nascer. Esse número ser menor que 1 significa que o aumento da idade está, na verdade, associado a uma menor chance de ter um bebê com baixo peso ao nascer.

Por exemplo, suponha que a Mãe A e a Mãe B fumem. Se a mãe A for um ano mais velha que a mãe B, então as chances da mãe A ter um bebê com baixo peso ao nascer são de apenas 95,1% das chances de a mãe B ter um bebê com baixo peso ao nascer. o nascimento.

P>|z| (idade): 0,119. Este é o valor p associado à estatística de teste para idade . Como esse valor não é inferior a 0,05, a idade não é um preditor estatisticamente significativo de baixo peso ao nascer.

Razão de probabilidade (fumaça): 0,6918486. Mantendo a idade constante, uma mãe que fuma durante a gravidez tem uma probabilidade maior exp(0,6918486) = 1,997 de ter um bebé com baixo peso à nascença do que uma mãe que não fuma durante a gravidez.

Por exemplo, suponha que a Mãe A e a Mãe B tenham ambas 30 anos. Se a mãe A fuma durante a gravidez e a mãe B não fuma, então as chances da mãe A ter um bebê com baixo peso ao nascer são 99,7% maiores do que as chances da mãe B ter um bebê com baixo peso ao nascer.

P>|z| (fumaça): 0,032. Este é o valor p associado à estatística de teste para fumaça . Como esse valor é inferior a 0,05, o tabagismo é um preditor estatisticamente significativo de baixo peso ao nascer.

Etapa 4: relatar os resultados.

Finalmente, gostaríamos de relatar os resultados da nossa regressão logística. Aqui está um exemplo de como fazer isso:

A regressão logística foi realizada para determinar se a idade da mãe e os hábitos de fumar afetam a probabilidade de ter um bebê com baixo peso ao nascer. Uma amostra de 189 mães foi utilizada na análise.

Os resultados mostraram que houve relação estatisticamente significativa entre tabagismo e probabilidade de baixo peso ao nascer (z = 2,15, p = 0,032), enquanto não houve relação estatisticamente significativa entre idade e probabilidade de baixo peso ao nascer (z = -1,56). , p = 0,032). 119).

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *