Jak utworzyć macierz zamieszania w programie excel
Regresja logistyczna to rodzaj regresji, którego możemy użyć, gdy zmienna odpowiedzi jest binarna.
Powszechnym sposobem oceny jakości modelu regresji logistycznej jest utworzenie macierzy zamieszania , czyli tabeli 2 × 2, która pokazuje przewidywane wartości modelu w porównaniu z rzeczywistymi wartościami testowego zbioru danych.
Poniższy przykład pokazuje krok po kroku, jak utworzyć macierz zamieszania w programie Excel.
Krok 1: Wprowadź dane
Najpierw wprowadźmy kolumnę rzeczywistych wartości zmiennej odpowiedzi wraz z wartościami przewidywanymi przez model regresji logistycznej:
Krok 2: Utwórz macierz zamieszania
Następnie użyjemy formuły COUNTIFS() do policzenia wartości, które w kolumnie Rzeczywiste wynoszą „0”, a także „0” w kolumnie Przewidywane:
Podobną formułą będziemy wypełniać wszystkie pozostałe komórki macierzy zamieszania:
Krok 3: Oblicz dokładność, precyzję i przypominanie
Po utworzeniu macierzy zamieszania możemy obliczyć następujące metryki:
- Dokładność : Procent poprawnych przewidywań
- Dokładność : Popraw pozytywne przewidywania w stosunku do wszystkich pozytywnych przewidywań
- Przypomnienie : Korygowanie pozytywnych przewidywań w stosunku do łącznej liczby rzeczywistych pozytywnych wyników
Poniższe formuły pokazują, jak obliczyć każdy z tych pomiarów w programie Excel:
Im większa precyzja, tym lepiej model jest w stanie poprawnie klasyfikować obserwacje.
W tym przykładzie nasz model ma dokładność 0,7 , co oznacza, że poprawnie sklasyfikował 70% obserwacji.
Jeśli chcemy, możemy porównać tę dokładność z dokładnością innych modeli regresji logistycznej, aby określić, który model najlepiej klasyfikuje obserwacje w kategoriach 0 lub 1.
Dodatkowe zasoby
Wprowadzenie do regresji logistycznej
Trzy rodzaje regresji logistycznej
Regresja logistyczna a regresja liniowa