O guia completo: como relatar resultados de regressão logística


A regressão logística é um tipo de análise de regressão que usamos quando a variável de resposta é binária.

Podemos usar o seguinte formato geral para relatar os resultados de um modelo de regressão logística:

A regressão logística foi utilizada para analisar a relação entre [variável preditora 1], [variável preditora 2],…[variável preditora n ] e [variável resposta].

Verificou-se que, mantendo todas as outras variáveis preditoras constantes, a probabilidade de [variável de resposta] ocorrer [aumentar ou diminuir] em [alguns por cento] (IC 95% [limite inferior, limite superior]) para um aumento de uma unidade em [variável preditora 1].

Verificou-se que, mantendo todas as outras variáveis preditoras constantes, a probabilidade de [variável de resposta] ocorrer [aumentar ou diminuir] em [alguns por cento] (IC 95% [limite inferior, limite superior]) para um aumento de uma unidade em [variável preditora 2].

Podemos usar esta sintaxe básica para relatar odds ratios e o intervalo de confiança de 95% correspondente para os odds ratios de cada variável preditora no modelo.

O exemplo a seguir mostra como relatar os resultados de um modelo de regressão logística na prática.

Exemplo: Relatório de Resultados de Regressão Logística

Suponha que um professor queira entender se dois programas de estudo diferentes (Programa A e Programa B) e o número de horas estudadas afetam a probabilidade de um aluno ser aprovado no exame final de sua turma.

Ele se ajusta a um modelo de regressão logística usando horas de estudo e programa de estudo como variáveis preditoras e resultado do exame (aprovação ou reprovação) como variável resposta.

A saída a seguir mostra os resultados do modelo de regressão logística:

 Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept) -2.415 0.623 -3.876 <0.000
program_A 0.344 0.156 2.205 0.027
hours 0.006 0.002 3.000 0.003

Antes de relatar os resultados do modelo de regressão logística, devemos primeiro calcular a razão de chances para cada variável preditora utilizando a fórmula e β .

Por exemplo, aqui está como calcular a razão de chances para cada variável preditora:

  • Razão de probabilidade do programa: e 0,344 = 1,41
  • Razão de chances de horas: e 0,006 = 1,006

Também precisamos calcular o intervalo de confiança de 95% para a razão de chances de cada variável preditora usando a fórmula e (β +/- 1,96*erro padrão) .

Por exemplo, aqui está como calcular a razão de chances para cada variável preditora:

  • IC de 95% para razão de chances do programa: e 0,344 +/- 1,96*0,156 = [1,04, 1,92]
  • IC de 95% para odds ratio de horas: e 0,006 +/- 1,96*0,002 = [1,002, 1,009]

Agora que calculamos a razão de chances e o intervalo de confiança correspondente para cada variável preditora, podemos relatar os resultados do modelo da seguinte forma:

A regressão logística foi utilizada para analisar a relação entre currículo e horas cursadas na probabilidade de aprovação em exame final.

Verificou-se que, mantendo constante o número de horas de estudo, as probabilidades de aprovação no exame final aumentaram 41% (IC 95% [0,04; 0,92]) para os alunos que utilizaram o programa de estudos A versus o programa de estudos B.

Verificou-se também que, mantendo o programa de estudos constante, as probabilidades de aprovação no exame final aumentaram 0,6% (IC 95% [0,002; 0,009]) por cada hora adicional estudada.

Observe que relatamos odds ratios para variáveis preditoras em oposição aos valores beta do modelo porque os odds ratios são mais fáceis de interpretar e compreender.

Recursos adicionais

Os tutoriais a seguir fornecem informações adicionais sobre regressão logística:

Introdução à regressão logística
Como realizar regressão logística em R
Como realizar regressão logística em Python
4 exemplos de uso de regressão logística na vida real

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *