Como interpretar coeficientes de regressão logística (com exemplo)
A regressão logística é um método que podemos usar para ajustar um modelo de regressão quando a variável de resposta é binária.
Quando ajustamos um modelo de regressão logística, os coeficientes dos resultados do modelo representam a mudança média no log da probabilidade da variável de resposta associada a um aumento de uma unidade na variável preditora.
β = Average Change in Log Odds of Response Variable
Muitas vezes queremos compreender a mudança média nas probabilidades da variável de resposta associada a um aumento de uma unidade na variável preditora, que podemos encontrar usando a fórmula e β .
e β = Average Change in Odds of Response Variable
O exemplo a seguir mostra como interpretar os coeficientes de regressão logística na prática.
Exemplo: Como interpretar coeficientes de regressão logística
Suponha que queiramos ajustar um modelo de regressão logística usando gênero e número de exames práticos realizados para prever se um aluno será aprovado ou não no exame final de uma aula.
Suponha que ajustamos o modelo usando software estatístico (como R, Python , Excel ou SAS ) e recebemos o seguinte resultado:
| Estimativa do coeficiente | Erro padrão | Valor Z | Valor P | |
|---|---|---|---|---|
| Interceptar | -1,34 | 0,23 | 5,83 | <0,001 |
| Sexo masculino) | -0,56 | 0,25 | 2.24 | 0,03 |
| Exames práticos | 1.13 | 0,43 | 2,63 | 0,01 |
Como interpretar o gênero (variável preditora binária)
Podemos perceber que a estimativa do coeficiente para gênero é negativa, indicando que ser do sexo masculino diminui as chances de aprovação no exame.
Também podemos observar que o valor p para gênero é inferior a 0,05, o que significa que tem um efeito estatisticamente significativo na aprovação ou não de um indivíduo no exame.
Para entender exatamente como ser homem afeta a aprovação ou não de um indivíduo no exame, podemos usar a fórmula e β .
e -0,56 = 0,57
Interpretamos que isto significa que os homens têm apenas 0,57 vezes mais probabilidades do que as mulheres de passar no exame, assumindo que o número de exames simulados permanece constante .
Poderíamos também dizer que os homens têm (1 – 0,57) 43% menos probabilidade de passar no exame do que as mulheres, assumindo novamente que o número de exames práticos permanece constante .
Como interpretar exames práticos (variável preditiva contínua)
Podemos constatar que a estimativa do coeficiente dos exames práticos é positiva, indicando que cada exame prático adicional realizado aumenta a chance de aprovação no exame final.
Podemos verificar também que o valor p do número de simulados realizados é inferior a 0,05, o que significa que tem um efeito estatisticamente significativo na aprovação ou não do indivíduo no exame final.
Para quantificar o impacto de cada exame prático adicional na aprovação ou não do indivíduo no exame final, podemos utilizar a fórmula e β .
e 1,13 = 3,09
Interpretamos isto como significando que cada exame prático adicional realizado aumenta a probabilidade de aprovação no exame final em 3,09 , assumindo que o género permanece constante .
Poderíamos também dizer que cada exame prático adicional realizado está associado a um aumento de (3,09 – 1) 209% nas probabilidades de aprovação no exame final, assumindo novamente que o género permanece constante.
Nota : Consulte este artigo para saber como interpretar o termo original em um modelo de regressão logística.
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre regressão logística:
Como relatar resultados de regressão logística
Compreendendo a hipótese nula para regressão logística
A diferença entre regressão logística e regressão linear