O guia completo: como relatar resultados de regressão logística
A regressão logística é um tipo de análise de regressão que usamos quando a variável de resposta é binária.
Podemos usar o seguinte formato geral para relatar os resultados de um modelo de regressão logística:
A regressão logística foi utilizada para analisar a relação entre [variável preditora 1], [variável preditora 2],…[variável preditora n ] e [variável resposta].
Verificou-se que, mantendo todas as outras variáveis preditoras constantes, a probabilidade de [variável de resposta] ocorrer [aumentar ou diminuir] em [alguns por cento] (IC 95% [limite inferior, limite superior]) para um aumento de uma unidade em [variável preditora 1].
Verificou-se que, mantendo todas as outras variáveis preditoras constantes, a probabilidade de [variável de resposta] ocorrer [aumentar ou diminuir] em [alguns por cento] (IC 95% [limite inferior, limite superior]) para um aumento de uma unidade em [variável preditora 2].
…
Podemos usar esta sintaxe básica para relatar odds ratios e o intervalo de confiança de 95% correspondente para os odds ratios de cada variável preditora no modelo.
O exemplo a seguir mostra como relatar os resultados de um modelo de regressão logística na prática.
Exemplo: Relatório de Resultados de Regressão Logística
Suponha que um professor queira entender se dois programas de estudo diferentes (Programa A e Programa B) e o número de horas estudadas afetam a probabilidade de um aluno ser aprovado no exame final de sua turma.
Ele se ajusta a um modelo de regressão logística usando horas de estudo e programa de estudo como variáveis preditoras e resultado do exame (aprovação ou reprovação) como variável resposta.
A saída a seguir mostra os resultados do modelo de regressão logística:
Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) -2.415 0.623 -3.876 <0.000 program_A 0.344 0.156 2.205 0.027 hours 0.006 0.002 3.000 0.003
Antes de relatar os resultados do modelo de regressão logística, devemos primeiro calcular a razão de chances para cada variável preditora utilizando a fórmula e β .
Por exemplo, aqui está como calcular a razão de chances para cada variável preditora:
- Razão de probabilidade do programa: e 0,344 = 1,41
- Razão de chances de horas: e 0,006 = 1,006
Também precisamos calcular o intervalo de confiança de 95% para a razão de chances de cada variável preditora usando a fórmula e (β +/- 1,96*erro padrão) .
Por exemplo, aqui está como calcular a razão de chances para cada variável preditora:
- IC de 95% para razão de chances do programa: e 0,344 +/- 1,96*0,156 = [1,04, 1,92]
- IC de 95% para odds ratio de horas: e 0,006 +/- 1,96*0,002 = [1,002, 1,009]
Agora que calculamos a razão de chances e o intervalo de confiança correspondente para cada variável preditora, podemos relatar os resultados do modelo da seguinte forma:
A regressão logística foi utilizada para analisar a relação entre currículo e horas cursadas na probabilidade de aprovação em exame final.
Verificou-se que, mantendo constante o número de horas de estudo, as probabilidades de aprovação no exame final aumentaram 41% (IC 95% [0,04; 0,92]) para os alunos que utilizaram o programa de estudos A versus o programa de estudos B.
Verificou-se também que, mantendo o programa de estudos constante, as probabilidades de aprovação no exame final aumentaram 0,6% (IC 95% [0,002; 0,009]) por cada hora adicional estudada.
Observe que relatamos odds ratios para variáveis preditoras em oposição aos valores beta do modelo porque os odds ratios são mais fáceis de interpretar e compreender.
Recursos adicionais
Os tutoriais a seguir fornecem informações adicionais sobre regressão logística:
Introdução à regressão logística
Como realizar regressão logística em R
Como realizar regressão logística em Python
4 exemplos de uso de regressão logística na vida real