Como criar uma matriz de confusão no excel
A regressão logística é um tipo de regressão que podemos usar quando a variável de resposta é binária.
Uma forma comum de avaliar a qualidade de um modelo de regressão logística é criar uma matriz de confusão , que é uma tabela 2 × 2 que mostra os valores previstos do modelo versus os valores reais do conjunto de dados de teste.
O exemplo passo a passo a seguir mostra como criar uma matriz de confusão no Excel.
Passo 1: Insira os dados
Primeiro, vamos inserir uma coluna de valores reais para uma variável de resposta junto com os valores previstos por um modelo de regressão logística:
Etapa 2: Crie a Matriz de Confusão
A seguir, usaremos a fórmula COUNTIFS() para contar o número de valores que são “0” na coluna Real e também “0” na coluna Predito:
Usaremos uma fórmula semelhante para preencher todas as outras células da matriz de confusão:
Etapa 3: calcular exatidão, precisão e recall
Depois de criarmos a matriz de confusão, podemos calcular as seguintes métricas:
- Precisão : porcentagem de previsões corretas
- Precisão : Previsões positivas corretas em relação ao total de previsões positivas
- Lembrete : corrigindo previsões positivas em relação ao total de positivos reais
As fórmulas a seguir mostram como calcular cada uma dessas medidas no Excel:
Quanto maior a precisão, mais o modelo é capaz de classificar corretamente as observações.
Neste exemplo, nosso modelo tem uma precisão de 0,7 , o que nos diz que classificou corretamente 70% das observações.
Se desejarmos, podemos comparar esta precisão com a de outros modelos de regressão logística para determinar qual modelo é melhor para classificar as observações em categorias de 0 ou 1.
Recursos adicionais
Introdução à regressão logística
Os 3 tipos de regressão logística
Regressão logística vs regressão linear