Hoe het snijpunt in een regressiemodel te interpreteren: met voorbeelden
Het snijpunt (ook wel de „constante“ genoemd) in een regressiemodel vertegenwoordigt de gemiddelde waarde van de responsvariabele wanneer alle voorspellende variabelen in het model gelijk zijn aan nul.
In deze zelfstudie wordt uitgelegd hoe u de oorspronkelijke waarde interpreteert in eenvoudige lineaire regressiemodellen en modellen met meerdere lineaire regressies.
Interpretatie van snijpunt in eenvoudige lineaire regressie
Een eenvoudig lineair regressiemodel heeft de volgende vorm:
ŷ = β 0 + β 1 (x)
Goud:
- ŷ: de voorspelde waarde voor de responsvariabele
- β 0 : De gemiddelde waarde van de responsvariabele wanneer x = 0
- β 1 : De gemiddelde verandering in de responsvariabele bij een toename van één eenheid in x
- x: de waarde van de voorspellende variabele
In sommige gevallen is het zinvol om de interceptwaarde te interpreteren in een eenvoudig lineair regressiemodel, maar niet altijd. De volgende voorbeelden illustreren dit.
Voorbeeld 1: De onderschepping is zinvol om te interpreteren
Stel dat we een eenvoudig lineair regressiemodel willen toepassen met bestudeerde uren als voorspellende variabele en examenscores als responsvariabele.
We verzamelen deze gegevens voor 50 studenten in een bepaalde universitaire opleiding en passen in het volgende regressiemodel:
Examenscore = 65,4 + 2,67 (uren)
De waarde van de oorspronkelijke term in dit model is 65,4 . Dit betekent dat de gemiddelde examenscore 65,4 bedraagt wanneer het aantal gestudeerde uren nul is.
Dit is logisch om te interpreteren, omdat het aannemelijk is dat een student nul uur studeert voor een examen.
Voorbeeld 2: Interceptie heeft geen zin om te interpreteren
Stel dat we een eenvoudig lineair regressiemodel willen passen met gewicht (in ponden) als voorspellende variabele en lengte (in inches) als responsvariabele.
We verzamelen deze gegevens voor 50 personen en passen het volgende regressiemodel toe:
Hoogte = 22,3 + 0,28 (pond)
De waarde van de oorspronkelijke term in dit model is 22,3 . Dit zou betekenen dat de lengte van de gemiddelde persoon 22,3 inch is als zijn gewicht nul is.
Dit heeft geen zin om te interpreteren, omdat het voor een persoon niet mogelijk is om nul pond te wegen.
We moeten echter nog steeds de oorspronkelijke term in het model behouden, zodat we het model kunnen gebruiken om voorspellingen te doen. Het snijpunt heeft eenvoudigweg geen betekenisvolle interpretatie voor dit model.
Interpretatie van Intercept in meervoudige lineaire regressie
Een meervoudig lineair regressiemodel heeft de volgende vorm:
ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )
Goud:
- ŷ: de voorspelde waarde voor de responsvariabele
- β 0 : De gemiddelde waarde van de responsvariabele wanneer alle voorspellende variabelen nul zijn
- βj : gemiddelde verandering in de responsvariabele voor een toename van één eenheid in de j -de voorspellende variabele, ervan uitgaande dat alle andere voorspellende variabelen constant blijven.
- x j : de waarde van de j -de voorspellende variabele
Net als bij eenvoudige lineaire regressie is het soms zinvol om de snijpuntwaarde te interpreteren in een meervoudig lineair regressiemodel, maar niet altijd. De volgende voorbeelden illustreren dit.
Voorbeeld 1: De onderschepping is zinvol om te interpreteren
Stel dat we een meervoudig lineair regressiemodel willen toepassen met studie-uren en voorbereidende examens als voorspellende variabelen en examenscores als responsvariabele.
We verzamelen deze gegevens voor 50 studenten in een bepaalde universitaire opleiding en passen in het volgende regressiemodel:
Examenscore = 58,4 + 2,23 (uren) + 1,34 (aantal voorbereidende examens)
De waarde van de oorspronkelijke term in dit model is 58,4 . Dit betekent dat de gemiddelde examenscore 58,4 bedraagt wanneer het aantal gestudeerde uren en het aantal afgelegde voorbereidende examens beide gelijk zijn aan nul.
Dit is logisch om te interpreteren, omdat het aannemelijk is dat een student nul uur studeert en geen voorbereidend examen aflegt vóór het examen zelf.
Voorbeeld 2: Interceptie heeft geen zin om te interpreteren
Stel dat we een meervoudig lineair regressiemodel willen toepassen met vierkante meters en het aantal slaapkamers als voorspellende variabelen en de verkoopprijs als responsvariabele.
We verzamelen deze gegevens voor 100 huizen in een bepaalde stad en passen het volgende regressiemodel toe:
Prijs = 87.244 + 3,44 (vierkante voet) + 843,45 (aantal slaapkamers)
De waarde van de oorspronkelijke term in dit model is 87.244 . Dit zou betekenen dat de gemiddelde verkoopprijs van een huis $ 87.244 bedraagt wanneer de vierkante meters en het aantal slaapkamers van een huis beide gelijk zijn aan nul.
Dit heeft geen zin om te interpreteren, aangezien het niet mogelijk is dat een huis nul vierkante meters en nul slaapkamers heeft.
We moeten echter nog steeds de oorspronkelijke term in het model behouden om deze te kunnen gebruiken om voorspellingen te doen. Het snijpunt heeft eenvoudigweg geen betekenisvolle interpretatie voor dit model.
Aanvullende bronnen
Inleiding tot eenvoudige lineaire regressie
Inleiding tot meervoudige lineaire regressie
Hoe gedeeltelijke regressiecoëfficiënten te interpreteren