Come creare una matrice di confusione in excel
La regressione logistica è un tipo di regressione che possiamo utilizzare quando la variabile di risposta è binaria.
Un modo comune per valutare la qualità di un modello di regressione logistica è creare una matrice di confusione , ovvero una tabella 2 × 2 che mostra i valori previsti del modello rispetto ai valori effettivi del set di dati di test.
Il seguente esempio passo passo mostra come creare una matrice di confusione in Excel.
Passaggio 1: inserisci i dati
Innanzitutto, inseriamo una colonna di valori effettivi per una variabile di risposta insieme ai valori previsti da un modello di regressione logistica:
Passaggio 2: crea la matrice di confusione
Successivamente, utilizzeremo la formula COUNTIFS() per contare il numero di valori che sono “0” nella colonna Attuale e anche “0” nella colonna Prevista:
Utilizzeremo una formula simile per riempire tutte le altre celle nella matrice di confusione:
Passaggio 3: calcolare accuratezza, precisione e richiamo
Una volta creata la matrice di confusione, possiamo calcolare le seguenti metriche:
- Precisione : percentuale di previsioni corrette
- Precisione : correggere le previsioni positive rispetto al totale delle previsioni positive
- Promemoria : correzione delle previsioni positive rispetto al totale dei positivi effettivi
Le seguenti formule mostrano come calcolare ciascuna di queste misurazioni in Excel:
Maggiore è la precisione, più un modello è in grado di classificare correttamente le osservazioni.
In questo esempio, il nostro modello ha una precisione di 0,7 che ci dice che ha classificato correttamente il 70% delle osservazioni.
Se lo desideriamo, possiamo confrontare questa accuratezza con quella di altri modelli di regressione logistica per determinare quale modello è il migliore nel classificare le osservazioni nelle categorie 0 o 1.
Risorse addizionali
Introduzione alla regressione logistica
I 3 tipi di regressione logistica
Regressione logistica vs regressione lineare