Como criar uma matriz de confusão no excel


A regressão logística é um tipo de regressão que podemos usar quando a variável de resposta é binária.

Uma forma comum de avaliar a qualidade de um modelo de regressão logística é criar uma matriz de confusão , que é uma tabela 2 × 2 que mostra os valores previstos do modelo versus os valores reais do conjunto de dados de teste.

O exemplo passo a passo a seguir mostra como criar uma matriz de confusão no Excel.

Passo 1: Insira os dados

Primeiro, vamos inserir uma coluna de valores reais para uma variável de resposta junto com os valores previstos por um modelo de regressão logística:

Etapa 2: Crie a Matriz de Confusão

A seguir, usaremos a fórmula COUNTIFS() para contar o número de valores que são “0” na coluna Real e também “0” na coluna Predito:

Usaremos uma fórmula semelhante para preencher todas as outras células da matriz de confusão:

matriz de confusão no Excel

Etapa 3: calcular exatidão, precisão e recall

Depois de criarmos a matriz de confusão, podemos calcular as seguintes métricas:

  • Precisão : porcentagem de previsões corretas
  • Precisão : Previsões positivas corretas em relação ao total de previsões positivas
  • Lembrete : corrigindo previsões positivas em relação ao total de positivos reais

As fórmulas a seguir mostram como calcular cada uma dessas medidas no Excel:

Quanto maior a precisão, mais o modelo é capaz de classificar corretamente as observações.

Neste exemplo, nosso modelo tem uma precisão de 0,7 , o que nos diz que classificou corretamente 70% das observações.

Se desejarmos, podemos comparar esta precisão com a de outros modelos de regressão logística para determinar qual modelo é melhor para classificar as observações em categorias de 0 ou 1.

Recursos adicionais

Introdução à regressão logística
Os 3 tipos de regressão logística
Regressão logística vs regressão linear

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *