Jak interpretować punkt przecięcia regresji logistycznej (z przykładem)


Regresja logistyczna to metoda, której możemy użyć do dopasowania modelu regresji, gdyzmienna odpowiedzi jest binarna.

Kiedy dopasowujemy model regresji logistycznej, pierwotny składnik w wynikach modelu reprezentuje logarytm szansy wystąpienia zmiennej odpowiedzi , gdy wszystkie zmienne predykcyjne są równe zero.

Jednakże, ponieważ prawdopodobieństwa logarytmiczne są trudne do zinterpretowania, zazwyczaj przedstawiamy wyraz wolny w kategoriach prawdopodobieństwa.

Możemy użyć poniższego wzoru, aby zrozumieć prawdopodobieństwo wystąpienia zmiennej odpowiedzi, zakładając, że każda zmienna predykcyjna w modelu wynosi zero:

 P = e β 0 / (1 +e β 0 )

Poniższy przykład pokazuje, jak w praktyce interpretować punkt przecięcia regresji logistycznej.

Powiązane: Jak interpretować współczynniki regresji logistycznej

Przykład: Jak interpretować punkt przecięcia regresji logistycznej

Załóżmy, że chcemy dopasować model regresji logistycznej, wykorzystując płeć i liczbę zdanych egzaminów praktycznych, aby przewidzieć, czy uczeń zda egzamin końcowy w klasie.

Załóżmy, że dopasowujemy model za pomocą oprogramowania statystycznego (takiego jak R, Python , Excel lub SAS ) i otrzymujemy następujący wynik:

Oszacowanie współczynnika Standardowy błąd Wartość Z Wartość P
Przechwycić -1,34 0,23 5,83 <0,001
Płeć (mężczyzna = 1) -0,56 0,25 2.24 0,03
Egzaminy praktyczne 1.13 0,43 2,63 0,01

Widzimy, że pierwotny termin ma wartość -1,34 .

Oznacza to, że gdy płeć wynosi zero (tj. studentka jest kobietą) i gdy liczba egzaminów praktycznych wynosi zero (student nie zdawał żadnych egzaminów praktycznych przygotowujących do egzaminu końcowego), logarytmiczna szansa na zdanie egzaminu wynosi -1,34 . .

Ponieważ logarytm szans jest trudny do zrozumienia, możemy zamiast tego przepisać wszystko w kategoriach prawdopodobieństwa:

  • Prawdopodobieństwo sukcesu = e β 0 / (1 +e β 0 )
  • Prawdopodobieństwo sukcesu = e -1,34 / (1 + e -1,34 )
  • Prawdopodobieństwo sukcesu = 0,208

Gdy obie zmienne predykcyjne są równe zero (tj. student, który nie zdawał żadnych egzaminów przygotowawczych), prawdopodobieństwo, że student zda egzamin końcowy wynosi 0,208 .

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat regresji logistycznej:

Jak raportować wyniki regresji logistycznej
Zrozumienie hipotezy zerowej dla regresji logistycznej
Różnica między regresją logistyczną a regresją liniową

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *