Logistieke regressiecoëfficiënten interpreteren (met voorbeeld)


Logistische regressie is een methode die we kunnen gebruiken om een regressiemodel te fitten wanneer deresponsvariabele binair is.

Wanneer we een logistisch regressiemodel passen, vertegenwoordigen de coëfficiënten van de modelresultaten de gemiddelde verandering in de logwaarschijnlijkheid van de responsvariabele geassocieerd met een toename van één eenheid in de voorspellende variabele.

 β = Average Change in Log Odds of Response Variable

We willen vaak de gemiddelde verandering in de waarschijnlijkheid van de responsvariabele begrijpen die gepaard gaat met een toename van één eenheid in de voorspellende variabele, die we kunnen vinden met behulp van de formule e β .

 e β = Average Change in Odds of Response Variable

Het volgende voorbeeld laat zien hoe u logistieke regressiecoëfficiënten in de praktijk kunt interpreteren.

Voorbeeld: hoe logistische regressiecoëfficiënten worden geïnterpreteerd

Stel dat we een logistisch regressiemodel willen toepassen op basis van het geslacht en het aantal afgelegde oefenexamens om te voorspellen of een leerling wel of niet zal slagen voor een eindexamen in een klas.

Stel dat we het model aanpassen met behulp van statistische software (zoals R, Python , Excel of SAS ) en het volgende resultaat krijgen:

Schatting van de coëfficiënt Standaardfout Z-waarde P-waarde
Onderscheppen -1,34 0,23 5,83 <0,001
Mannelijk geslacht) -0,56 0,25 2.24 0,03
Praktische examens 1.13 0,43 2.63 0,01

Hoe geslacht te interpreteren (binaire voorspellende variabele)

We kunnen zien dat de schatting van de coëfficiënten voor geslacht negatief is, wat aangeeft dat het man-zijn de kans op het behalen van het examen verkleint.

We kunnen ook zien dat de p-waarde voor geslacht kleiner is dan 0,05, wat betekent dat dit een statistisch significant effect heeft op het al dan niet slagen van het examen.

Om precies te begrijpen hoe het mannelijk zijn van invloed is op het al dan niet slagen van het examen, kunnen we de formule e β gebruiken.

e -0,56 = 0,57

Wij interpreteren dit zo dat mannen slechts 0,57 keer meer kans hebben dan vrouwen om het examen te halen, ervan uitgaande dat het aantal oefenexamens constant blijft .

We zouden ook kunnen zeggen dat mannen (1 – 0,57) 43% minder kans hebben om het examen te halen dan vrouwen, opnieuw ervan uitgaande dat het aantal oefenexamens constant blijft .

Hoe praktijkexamens te interpreteren (continu voorspellende variabele)

We zien dat de coëfficiëntenschatting voor praktijkexamens positief is, wat aangeeft dat elk bijkomend praktijkexamen de kans vergroot om voor het eindexamen te slagen.

We kunnen ook zien dat de p-waarde voor het aantal afgelegde oefenexamens kleiner is dan 0,05, wat betekent dat dit een statistisch significant effect heeft op het al dan niet slagen van het eindexamen.

Om de impact van elk aanvullend praktijkexamen op het al dan niet slagen van het eindexamen te kwantificeren, kunnen we de formule e β gebruiken.

e 1,13 = 3,09

Wij interpreteren dit zo dat elk extra afgelegd praktijkexamen de kans op het behalen van het eindexamen met 3,09 vergroot, ervan uitgaande dat het geslacht constant blijft .

We zouden ook kunnen zeggen dat elk extra afgelegd oefenexamen gepaard gaat met een toename van (3,09 – 1) 209% in de kans om te slagen voor het eindexamen, opnieuw ervan uitgaande dat het geslacht constant blijft.

Opmerking : raadpleeg dit artikel om te leren hoe u de oorspronkelijke term in een logistisch regressiemodel interpreteert.

Aanvullende bronnen

De volgende zelfstudies bieden aanvullende informatie over logistische regressie:

Hoe logistieke regressieresultaten te rapporteren
De nulhypothese voor logistieke regressie begrijpen
Het verschil tussen logistische regressie en lineaire regressie

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert