So erstellen sie eine verwirrungsmatrix in excel
Die logistische Regression ist eine Art Regression, die wir verwenden können, wenn die Antwortvariable binär ist.
Eine gängige Methode zur Beurteilung der Qualität eines logistischen Regressionsmodells besteht darin, eine Verwirrungsmatrix zu erstellen, bei der es sich um eine 2 × 2-Tabelle handelt, die die vorhergesagten Werte des Modells im Vergleich zu den tatsächlichen Werten des Testdatensatzes zeigt.
Das folgende Schritt-für-Schritt-Beispiel zeigt, wie Sie in Excel eine Verwirrungsmatrix erstellen.
Schritt 1: Geben Sie die Daten ein
Geben wir zunächst eine Spalte mit tatsächlichen Werten für eine Antwortvariable zusammen mit den durch ein logistisches Regressionsmodell vorhergesagten Werten ein:
Schritt 2: Erstellen Sie die Verwirrungsmatrix
Als Nächstes verwenden wir die COUNTIFS() -Formel, um die Anzahl der Werte zu zählen, die in der Spalte „Ist“ „0“ und in der Spalte „Vorhergesagt“ ebenfalls „0“ sind:
Wir werden eine ähnliche Formel verwenden, um alle anderen Zellen in der Verwirrungsmatrix zu füllen:
Schritt 3: Berechnen Sie Genauigkeit, Präzision und Rückruf
Sobald wir die Verwirrungsmatrix erstellt haben, können wir die folgenden Metriken berechnen:
- Genauigkeit : Prozentsatz der richtigen Vorhersagen
- Genauigkeit : Korrigieren Sie positive Vorhersagen im Verhältnis zur Gesamtzahl der positiven Vorhersagen
- Erinnerung : Korrigieren Sie positive Vorhersagen anhand der gesamten tatsächlichen positiven Ergebnisse
Die folgenden Formeln zeigen, wie jede dieser Messungen in Excel berechnet wird:
Je höher die Präzision, desto besser kann ein Modell Beobachtungen korrekt klassifizieren.
In diesem Beispiel hat unser Modell eine Genauigkeit von 0,7, was uns sagt, dass es 70 % der Beobachtungen korrekt klassifiziert hat.
Wenn wir möchten, können wir diese Genauigkeit mit der anderer logistischer Regressionsmodelle vergleichen, um zu bestimmen, welches Modell Beobachtungen am besten in die Kategorien 0 oder 1 klassifizieren kann.
Zusätzliche Ressourcen
Einführung in die logistische Regression
Die 3 Arten der logistischen Regression
Logistische Regression vs. lineare Regression