De 3 soorten logistieke regressie (inclusief voorbeelden)
Logistische regressie verwijst naar elk regressiemodel waarin deresponsvariabele categorisch is.
Er zijn drie soorten logistische regressiemodellen:
- Binaire logistische regressie : de responsvariabele kan slechts tot een van de twee categorieën behoren.
- Multinomiale logistische regressie : de responsvariabele kan in een van drie of meer categorieën vallen en er is geen natuurlijke ordening tussen de categorieën.
- Ordinale logistische regressie : de responsvariabele kan in een van drie of meer categorieën vallen en er bestaat een natuurlijke ordening tussen de categorieën.
De volgende tabel vat deze verschillen samen:
Deze tutorial biedt een korte uitleg van elk type logistisch regressiemodel, samen met voorbeelden van elk type.
Type #1: binaire logistische regressie
Binaire logistische regressiemodellen zijn een soort logistieke regressie waarbij de responsvariabele slechts in twee categorieën kan vallen.
Hier zijn enkele voorbeelden:
Voorbeeld 1: NBA-concept
Stel dat een sportdatawetenschapper de voorspellende variabelen (1) punten, (2) rebounds en (3) assists wil gebruiken om de waarschijnlijkheid te voorspellen dat een bepaalde universiteitsbasketbalspeler wordt opgeroepen voor de NBA.
Omdat er slechts twee mogelijke uitkomsten (geschreven of ongeschreven) zijn voor de responsvariabele, zou de datawetenschapper een binomiaal logistisch regressiemodel gebruiken.
Voorbeeld 2: Spamdetectie
Stel dat een bedrijf de voorspellende variabelen (1) aantal woorden en (2) land van herkomst wil gebruiken om de waarschijnlijkheid te voorspellen dat een bepaalde e-mail spam is.
Omdat er slechts twee mogelijke uitkomsten zijn (spam of niet-spam) voor de responsvariabele, zou het bedrijf een binomiaal logistisch regressiemodel gebruiken.
Type nr. 2: Multinomiale logistische regressie
Multinomiale logistische regressiemodellen zijn een soort logistieke regressie waarbij de responsvariabele in een van de drie of meer categorieën kan vallen en er geen natuurlijke ordening tussen de categorieën bestaat.
Hier zijn enkele voorbeelden:
Voorbeeld 1: Politieke voorkeur
Stel dat een politicoloog de voorspellende variabelen (1) jaarinkomen en (2) jaren opleiding wil gebruiken om de waarschijnlijkheid te voorspellen dat een individu op een van de vier verschillende presidentskandidaten zal stemmen.
Omdat er meer dan twee mogelijke uitkomsten zijn (er zijn vier potentiële kandidaten) voor de responsvariabele en er geen natuurlijke ordening tussen de uitkomsten bestaat, zou de politicoloog een multinomiaal logistisch regressiemodel gebruiken.
Voorbeeld 2: Sportvoorkeur
Stel dat een sportanalist de voorspellende variabelen (1) uur televisiekijken per week en (2) leeftijd wil gebruiken om de waarschijnlijkheid te voorspellen dat een individu basketbal, voetbal of honkbal als favoriete sport zal kiezen.
Omdat er meer dan twee mogelijke uitkomsten zijn (er zijn drie sporten) voor de responsvariabele, zal de sportanalist een multinomiaal logistisch regressiemodel gebruiken.
Type #3: Ordinale logistische regressie
Ordinale logistische regressiemodellen zijn een soort logistische regressie waarbij de responsvariabele in een van de drie of meer categorieën kan vallen en er een natuurlijke ordening tussen de categorieën bestaat .
Hier zijn enkele voorbeelden:
Voorbeeld 1: schoolbeoordelingen
Stel dat een studieadviseur de voorspellende variabelen (1) GPA, (2) ACT-score en (3) SAT-score wil gebruiken om de waarschijnlijkheid te voorspellen dat een individu naar een universiteit gaat die kan worden gecategoriseerd als ‘slecht’, ‘middelmatig’. . », “goed” of “geweldig”.
Omdat er meer dan twee mogelijke uitkomsten zijn (er zijn vier classificaties van schoolkwaliteit) voor de responsvariabele en er een natuurlijke ordening tussen de uitkomsten bestaat , zou de schoolbegeleider een ordinaal logistisch regressiemodel gebruiken.
Voorbeeld 2: Filmbeoordelingen
Stel dat een filmcriticus de voorspellende variabelen (1) totale speelduur en (2) genre wil gebruiken om de waarschijnlijkheid te voorspellen dat een bepaalde film een beoordeling tussen 1 en 10 krijgt.
Omdat er meer dan twee mogelijke uitkomsten zijn (er zijn tien mogelijke beoordelingen) voor de responsvariabele en er een natuurlijke ordening bestaat tussen de uitkomsten, zou de filmcriticus een ordinaal logistisch regressiemodel gebruiken.
Aanvullende bronnen
De volgende tutorials bieden meer details over logistieke regressiemodellen:
Inleiding tot logistieke regressie
De 6 hypothesen van logistische regressie
4 voorbeelden van het gebruik van logistieke regressie in het echte leven