Jak utworzyć macierz zamieszania w programie excel


Regresja logistyczna to rodzaj regresji, którego możemy użyć, gdy zmienna odpowiedzi jest binarna.

Powszechnym sposobem oceny jakości modelu regresji logistycznej jest utworzenie macierzy zamieszania , czyli tabeli 2 × 2, która pokazuje przewidywane wartości modelu w porównaniu z rzeczywistymi wartościami testowego zbioru danych.

Poniższy przykład pokazuje krok po kroku, jak utworzyć macierz zamieszania w programie Excel.

Krok 1: Wprowadź dane

Najpierw wprowadźmy kolumnę rzeczywistych wartości zmiennej odpowiedzi wraz z wartościami przewidywanymi przez model regresji logistycznej:

Krok 2: Utwórz macierz zamieszania

Następnie użyjemy formuły COUNTIFS() do policzenia wartości, które w kolumnie Rzeczywiste wynoszą „0”, a także „0” w kolumnie Przewidywane:

Podobną formułą będziemy wypełniać wszystkie pozostałe komórki macierzy zamieszania:

macierz zamieszania w Excelu

Krok 3: Oblicz dokładność, precyzję i przypominanie

Po utworzeniu macierzy zamieszania możemy obliczyć następujące metryki:

  • Dokładność : Procent poprawnych przewidywań
  • Dokładność : Popraw pozytywne przewidywania w stosunku do wszystkich pozytywnych przewidywań
  • Przypomnienie : Korygowanie pozytywnych przewidywań w stosunku do łącznej liczby rzeczywistych pozytywnych wyników

Poniższe formuły pokazują, jak obliczyć każdy z tych pomiarów w programie Excel:

Im większa precyzja, tym lepiej model jest w stanie poprawnie klasyfikować obserwacje.

W tym przykładzie nasz model ma dokładność 0,7 , co oznacza, że poprawnie sklasyfikował 70% obserwacji.

Jeśli chcemy, możemy porównać tę dokładność z dokładnością innych modeli regresji logistycznej, aby określić, który model najlepiej klasyfikuje obserwacje w kategoriach 0 lub 1.

Dodatkowe zasoby

Wprowadzenie do regresji logistycznej
Trzy rodzaje regresji logistycznej
Regresja logistyczna a regresja liniowa

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *