Como realizar regressão logística no stata
A regressão logística é um método que usamos para ajustar um modelo de regressão quando a variável de resposta é binária. Aqui estão alguns exemplos de uso de regressão logística:
- Queremos saber como o exercício, a dieta e o peso afetam a probabilidade de ter um ataque cardíaco. A variável de resposta é o ataque cardíaco e tem dois resultados potenciais: ocorre ou não ocorre um ataque cardíaco.
- Queremos saber como o GPA, a pontuação do ACT e o número de cursos AP realizados impactam a probabilidade de ser aceito em uma determinada universidade. A variável resposta é a aceitação e tem dois resultados potenciais: aceito ou não aceito.
- Queremos saber se a contagem de palavras e o título do e-mail afetam a probabilidade de um e-mail ser spam. A variável de resposta é spam e tem dois resultados potenciais: spam ou não spam.
Este tutorial explica como realizar regressão logística no Stata.
Exemplo: regressão logística no Stata
Suponha que queremos entender se a idade da mãe e os hábitos de fumar afetam a probabilidade de ter um bebê com baixo peso ao nascer.
Para explorar isso, podemos realizar regressão logística usando idade e tabagismo (sim ou não) como variáveis explicativas e baixo peso ao nascer (sim ou não) como variável resposta. Como a variável resposta é binária – existem apenas dois resultados possíveis – a regressão logística deve ser utilizada.
Conclua as etapas a seguir no Stata para realizar a regressão logística usando o conjunto de dados chamado lbw , que contém dados de 189 mães diferentes.
Etapa 1: carregar dados.
Carregue os dados digitando o seguinte na caixa de comando:
use https://www.stata-press.com/data/r13/lbw
Etapa 2: obtenha um resumo dos dados.
Obtenha uma compreensão rápida dos dados com os quais você está trabalhando digitando o seguinte na caixa Comando:
resumir
Podemos ver que existem 11 variáveis diferentes no conjunto de dados, mas as únicas três que nos interessam são:
- baixo – se o bebê tem ou não baixo peso ao nascer. 1 = sim, 0 = não.
- idade – idade da mãe.
- fumaça – se a mãe fumou ou não durante a gravidez. 1 = sim, 0 = não.
Etapa 3: Execute a regressão logística.
Digite o seguinte na caixa de comando para realizar uma regressão logística usando idade e fumo como variáveis explicativas e baixo como variável de resposta.
logit de fumaça de baixa idade
Veja como interpretar os números mais interessantes no resultado:
Coef (idade): -0,0497792. Mantendo o fumo constante, cada ano de aumento na idade está associado a um aumento exp(-0,0497792) = 0,951 nas probabilidades de um bebé ter baixo peso ao nascer. Esse número ser menor que 1 significa que o aumento da idade está, na verdade, associado a uma menor chance de ter um bebê com baixo peso ao nascer.
Por exemplo, suponha que a Mãe A e a Mãe B fumem. Se a mãe A for um ano mais velha que a mãe B, então as chances da mãe A ter um bebê com baixo peso ao nascer são de apenas 95,1% das chances de a mãe B ter um bebê com baixo peso ao nascer. o nascimento.
P>|z| (idade): 0,119. Este é o valor p associado à estatística de teste para idade . Como esse valor não é inferior a 0,05, a idade não é um preditor estatisticamente significativo de baixo peso ao nascer.
Razão de probabilidade (fumaça): 0,6918486. Mantendo a idade constante, uma mãe que fuma durante a gravidez tem uma probabilidade maior exp(0,6918486) = 1,997 de ter um bebé com baixo peso à nascença do que uma mãe que não fuma durante a gravidez.
Por exemplo, suponha que a Mãe A e a Mãe B tenham ambas 30 anos. Se a mãe A fuma durante a gravidez e a mãe B não fuma, então as chances da mãe A ter um bebê com baixo peso ao nascer são 99,7% maiores do que as chances da mãe B ter um bebê com baixo peso ao nascer.
P>|z| (fumaça): 0,032. Este é o valor p associado à estatística de teste para fumaça . Como esse valor é inferior a 0,05, o tabagismo é um preditor estatisticamente significativo de baixo peso ao nascer.
Etapa 4: relatar os resultados.
Finalmente, gostaríamos de relatar os resultados da nossa regressão logística. Aqui está um exemplo de como fazer isso:
A regressão logística foi realizada para determinar se a idade da mãe e os hábitos de fumar afetam a probabilidade de ter um bebê com baixo peso ao nascer. Uma amostra de 189 mães foi utilizada na análise.
Os resultados mostraram que houve relação estatisticamente significativa entre tabagismo e probabilidade de baixo peso ao nascer (z = 2,15, p = 0,032), enquanto não houve relação estatisticamente significativa entre idade e probabilidade de baixo peso ao nascer (z = -1,56). , p = 0,032). 119).