Como interpretar coeficientes de regressão logística (com exemplo)


A regressão logística é um método que podemos usar para ajustar um modelo de regressão quando a variável de resposta é binária.

Quando ajustamos um modelo de regressão logística, os coeficientes dos resultados do modelo representam a mudança média no log da probabilidade da variável de resposta associada a um aumento de uma unidade na variável preditora.

 β = Average Change in Log Odds of Response Variable

Muitas vezes queremos compreender a mudança média nas probabilidades da variável de resposta associada a um aumento de uma unidade na variável preditora, que podemos encontrar usando a fórmula e β .

 e β = Average Change in Odds of Response Variable

O exemplo a seguir mostra como interpretar os coeficientes de regressão logística na prática.

Exemplo: Como interpretar coeficientes de regressão logística

Suponha que queiramos ajustar um modelo de regressão logística usando gênero e número de exames práticos realizados para prever se um aluno será aprovado ou não no exame final de uma aula.

Suponha que ajustamos o modelo usando software estatístico (como R, Python , Excel ou SAS ) e recebemos o seguinte resultado:

Estimativa do coeficiente Erro padrão Valor Z Valor P
Interceptar -1,34 0,23 5,83 <0,001
Sexo masculino) -0,56 0,25 2.24 0,03
Exames práticos 1.13 0,43 2,63 0,01

Como interpretar o gênero (variável preditora binária)

Podemos perceber que a estimativa do coeficiente para gênero é negativa, indicando que ser do sexo masculino diminui as chances de aprovação no exame.

Também podemos observar que o valor p para gênero é inferior a 0,05, o que significa que tem um efeito estatisticamente significativo na aprovação ou não de um indivíduo no exame.

Para entender exatamente como ser homem afeta a aprovação ou não de um indivíduo no exame, podemos usar a fórmula e β .

e -0,56 = 0,57

Interpretamos que isto significa que os homens têm apenas 0,57 vezes mais probabilidades do que as mulheres de passar no exame, assumindo que o número de exames simulados permanece constante .

Poderíamos também dizer que os homens têm (1 – 0,57) 43% menos probabilidade de passar no exame do que as mulheres, assumindo novamente que o número de exames práticos permanece constante .

Como interpretar exames práticos (variável preditiva contínua)

Podemos constatar que a estimativa do coeficiente dos exames práticos é positiva, indicando que cada exame prático adicional realizado aumenta a chance de aprovação no exame final.

Podemos verificar também que o valor p do número de simulados realizados é inferior a 0,05, o que significa que tem um efeito estatisticamente significativo na aprovação ou não do indivíduo no exame final.

Para quantificar o impacto de cada exame prático adicional na aprovação ou não do indivíduo no exame final, podemos utilizar a fórmula e β .

e 1,13 = 3,09

Interpretamos isto como significando que cada exame prático adicional realizado aumenta a probabilidade de aprovação no exame final em 3,09 , assumindo que o género permanece constante .

Poderíamos também dizer que cada exame prático adicional realizado está associado a um aumento de (3,09 – 1) 209% nas probabilidades de aprovação no exame final, assumindo novamente que o género permanece constante.

Nota : Consulte este artigo para saber como interpretar o termo original em um modelo de regressão logística.

Recursos adicionais

Os tutoriais a seguir fornecem informações adicionais sobre regressão logística:

Como relatar resultados de regressão logística
Compreendendo a hipótese nula para regressão logística
A diferença entre regressão logística e regressão linear

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *