Die 3 arten der logistischen regression (einschließlich beispiele)
Unter logistischer Regression versteht man jedes Regressionsmodell, bei dem die Antwortvariable kategorial ist.
Es gibt drei Arten von logistischen Regressionsmodellen:
- Binäre logistische Regression : Die Antwortvariable kann nur einer der beiden Kategorien angehören.
- Multinomiale logistische Regression : Die Antwortvariable kann in eine von drei oder mehr Kategorien fallen und es gibt keine natürliche Reihenfolge zwischen den Kategorien.
- Ordinale logistische Regression : Die Antwortvariable kann in eine von drei oder mehr Kategorien fallen und es besteht eine natürliche Reihenfolge zwischen den Kategorien.
Die folgende Tabelle fasst diese Unterschiede zusammen:
Dieses Tutorial bietet eine kurze Erläuterung jedes Typs von logistischem Regressionsmodell sowie Beispiele dafür.
Typ Nr. 1: binäre logistische Regression
Binäre logistische Regressionsmodelle sind eine Art logistischer Regression, bei der die Antwortvariable nur in zwei Kategorien fallen kann.
Hier sind einige Beispiele:
Beispiel 1: NBA Draft
Angenommen, ein Sportdatenwissenschaftler möchte die Prädiktorvariablen (1) Punkte, (2) Rebounds und (3) Assists verwenden, um die Wahrscheinlichkeit vorherzusagen, dass ein bestimmter College-Basketballspieler in die NBA eingezogen wird.
Da es für die Antwortvariable nur zwei mögliche Ergebnisse (geschrieben oder ungeschrieben) gibt, würde der Datenwissenschaftler ein binomiales logistisches Regressionsmodell verwenden.
Beispiel 2: Spam-Erkennung
Angenommen, ein Unternehmen möchte die Prädiktorvariablen (1) Wortanzahl und (2) Herkunftsland verwenden, um die Wahrscheinlichkeit vorherzusagen, dass es sich bei einer bestimmten E-Mail um Spam handelt.
Da es für die Antwortvariable nur zwei mögliche Ergebnisse (Spam oder Nicht-Spam) gibt, würde das Unternehmen ein binomiales logistisches Regressionsmodell verwenden.
Typ Nr. 2: Multinomiale logistische Regression
Multinomiale logistische Regressionsmodelle sind eine Art logistischer Regression, bei der die Antwortvariable in eine von drei oder mehr Kategorien fallen kann und es keine natürliche Reihenfolge zwischen den Kategorien gibt.
Hier sind einige Beispiele:
Beispiel 1: Politische Präferenz
Angenommen, ein Politikwissenschaftler möchte mithilfe der Prädiktorvariablen (1) Jahreseinkommen und (2) Bildungsjahre die Wahrscheinlichkeit vorhersagen, mit der eine Person für einen von vier verschiedenen Präsidentschaftskandidaten stimmen wird.
Da es mehr als zwei mögliche Ergebnisse (es gibt vier potenzielle Kandidaten) für die Antwortvariable gibt und es keine natürliche Reihenfolge zwischen den Ergebnissen gibt, würde der Politikwissenschaftler ein multinomiales logistisches Regressionsmodell verwenden.
Beispiel 2: Sportpräferenz
Angenommen, ein Sportanalyst möchte die Prädiktorvariablen (1) Fernsehstunden pro Woche und (2) Alter verwenden, um die Wahrscheinlichkeit vorherzusagen, mit der eine Person Basketball, Fußball oder Baseball als ihre Lieblingssportart wählt.
Da es für die Antwortvariable mehr als zwei mögliche Ergebnisse (es gibt drei Sportarten) gibt, verwendet der Sportanalyst ein multinomiales logistisches Regressionsmodell.
Typ #3: Ordinale logistische Regression
Ordinale logistische Regressionsmodelle sind eine Art logistischer Regression, bei der die Antwortvariable in eine von drei oder mehr Kategorien fallen kann und zwischen den Kategorien eine natürliche Reihenfolge besteht .
Hier sind einige Beispiele:
Beispiel 1: Schulbeurteilungen
Angenommen, ein Hochschulberater möchte die Prädiktorvariablen (1) GPA, (2) ACT-Score und (3) SAT-Score verwenden, um die Wahrscheinlichkeit vorherzusagen, dass eine Person ein College besuchen wird, das als „schlecht“, „mittelmäßig“ kategorisiert werden kann. . », „gut“ oder „großartig“.
Da es mehr als zwei mögliche Ergebnisse (es gibt vier Klassifizierungen der Schulqualität) für die Antwortvariable gibt und eine natürliche Reihenfolge zwischen den Ergebnissen besteht , würde der Schulberater ein ordinales logistisches Regressionsmodell verwenden.
Beispiel 2: Filmbewertungen
Angenommen, ein Filmkritiker möchte die Prädiktorvariablen (1) Gesamtlaufzeit und (2) Genre verwenden, um die Wahrscheinlichkeit vorherzusagen, dass ein bestimmter Film eine Bewertung zwischen 1 und 10 erhält.
Da es mehr als zwei mögliche Ergebnisse (es gibt 10 mögliche Bewertungen) für die Antwortvariable gibt und eine natürliche Reihenfolge zwischen den Ergebnissen besteht , würde der Filmkritiker ein ordinales logistisches Regressionsmodell verwenden.
Zusätzliche Ressourcen
Die folgenden Tutorials bieten weitere Details zu logistischen Regressionsmodellen:
Einführung in die logistische Regression
Die 6 Hypothesen der logistischen Regression
4 Beispiele für die Verwendung der logistischen Regression im wirklichen Leben