So interpretieren sie den achsenabschnitt in einem regressionsmodell: mit beispielen
Der Achsenabschnitt (manchmal auch „Konstante“ genannt) in einem Regressionsmodell stellt den Durchschnittswert der Antwortvariablen dar, wenn alle Prädiktorvariablen im Modell gleich Null sind.
In diesem Tutorial wird erläutert, wie der ursprüngliche Wert in einfachen linearen Regressionsmodellen und mehreren linearen Regressionsmodellen interpretiert wird.
Interpretation der Schnittmenge in der einfachen linearen Regression
Ein einfaches lineares Regressionsmodell hat die folgende Form:
ŷ = β 0 + β 1 (x)
Gold:
- ŷ: der vorhergesagte Wert für die Antwortvariable
- β 0 : Der Durchschnittswert der Antwortvariablen, wenn x = 0
- β 1 : Die durchschnittliche Änderung der Antwortvariablen bei einem Anstieg von x um eine Einheit
- x: der Wert der Vorhersagevariablen
In manchen Fällen ist es sinnvoll, den Schnittpunktwert in einem einfachen linearen Regressionsmodell zu interpretieren, aber nicht immer. Die folgenden Beispiele veranschaulichen dies.
Beispiel 1: Das Abfangen ist sinnvoll zu interpretieren
Angenommen, wir möchten ein einfaches lineares Regressionsmodell anpassen, indem wir die untersuchten Stunden als Prädiktorvariable und die Prüfungsergebnisse als Antwortvariable verwenden.
Wir erheben diese Daten für 50 Studierende eines bestimmten Universitätsstudiengangs und passen das folgende Regressionsmodell an:
Prüfungsergebnis = 65,4 + 2,67 (Stunden)
Der Wert des Originalterms in diesem Modell beträgt 65,4 . Dies bedeutet, dass die durchschnittliche Prüfungspunktzahl 65,4 beträgt, wenn die Anzahl der Lernstunden Null beträgt.
Dies ist sinnvoll zu interpretieren, da es plausibel ist, dass ein Student null Stunden für eine Prüfung lernt.
Beispiel 2: Das Abfangen ist nicht sinnvoll zu interpretieren
Angenommen, wir möchten ein einfaches lineares Regressionsmodell anpassen, das das Gewicht (in Pfund) als Prädiktorvariable und die Körpergröße (in Zoll) als Antwortvariable verwendet.
Wir sammeln diese Daten für 50 Personen und wenden das folgende Regressionsmodell an:
Körpergröße = 22,3 + 0,28 (Pfund)
Der Wert des ursprünglichen Termes in diesem Modell beträgt 22,3 . Dies würde bedeuten, dass die durchschnittliche Körpergröße einer Person 22,3 Zoll beträgt, wenn ihr Gewicht Null ist.
Diese Interpretation macht keinen Sinn, da es für eine Person nicht möglich ist, null Pfund zu wiegen.
Wir müssen jedoch weiterhin den ursprünglichen Term im Modell beibehalten, damit wir das Modell für Vorhersagen verwenden können. Der Achsenabschnitt hat für dieses Modell einfach keine sinnvolle Interpretation.
Interpretation des Achsenabschnitts in der multiplen linearen Regression
Ein multiples lineares Regressionsmodell hat die folgende Form:
ŷ = β 0 + β 1 (x 1 ) + β 2 (x 2 ) + β 3 (x 3 ) + … + β k (x k )
Gold:
- ŷ: der vorhergesagte Wert für die Antwortvariable
- β 0 : Der Durchschnittswert der Antwortvariablen, wenn alle Prädiktorvariablen Null sind
- β j : durchschnittliche Änderung der Antwortvariablen für einen Anstieg der j- ten Prädiktorvariablen um eine Einheit unter der Annahme, dass alle anderen Prädiktorvariablen konstant bleiben.
- x j : der Wert der j- ten Vorhersagevariablen
Ähnlich wie bei der einfachen linearen Regression ist es manchmal sinnvoll, den Schnittpunktwert in einem multiplen linearen Regressionsmodell zu interpretieren, aber nicht immer. Die folgenden Beispiele veranschaulichen dies.
Beispiel 1: Das Abfangen ist sinnvoll zu interpretieren
Angenommen, wir möchten ein multiples lineares Regressionsmodell anpassen, indem wir Studienstunden und Vorbereitungsprüfungen als Prädiktorvariablen und Prüfungsergebnisse als Antwortvariable verwenden.
Wir erheben diese Daten für 50 Studierende eines bestimmten Universitätsstudiengangs und passen das folgende Regressionsmodell an:
Prüfungsergebnis = 58,4 + 2,23 (Stunden) + 1,34 (Anzahl der Vorbereitungsprüfungen)
Der Wert des Originalterms in diesem Modell beträgt 58,4 . Das bedeutet, dass die durchschnittliche Prüfungspunktzahl 58,4 beträgt, wenn sowohl die Anzahl der gelernten Stunden als auch die Anzahl der abgelegten Vorbereitungsprüfungen gleich Null sind.
Dies ist sinnvoll zu interpretieren, da es plausibel ist, dass ein Student null Stunden lang lernt und vor der eigentlichen Prüfung keine Vorbereitungsprüfungen ablegt.
Beispiel 2: Das Abfangen ist nicht sinnvoll zu interpretieren
Angenommen, wir möchten ein multiples lineares Regressionsmodell anpassen, bei dem die Quadratmeterzahl und die Anzahl der Schlafzimmer als Prädiktorvariablen und der Verkaufspreis als Antwortvariable verwendet werden.
Wir sammeln diese Daten für 100 Häuser in einer bestimmten Stadt und wenden das folgende Regressionsmodell an:
Preis = 87.244 + 3,44 (Quadratfuß) + 843,45 (Anzahl der Schlafzimmer)
Der Wert des ursprünglichen Termes in diesem Modell beträgt 87,244 . Dies würde bedeuten, dass der durchschnittliche Hausverkaufspreis 87.244 US-Dollar beträgt, wenn sowohl die Quadratmeterzahl als auch die Anzahl der Schlafzimmer eines Hauses gleich Null sind.
Diese Interpretation macht keinen Sinn, da es nicht möglich ist, dass ein Haus null Quadratmeter und null Schlafzimmer hat.
Allerdings müssen wir den ursprünglichen Term weiterhin im Modell behalten, um ihn für Vorhersagen verwenden zu können. Der Achsenabschnitt hat für dieses Modell einfach keine sinnvolle Interpretation.
Zusätzliche Ressourcen
Einführung in die einfache lineare Regression
Einführung in die multiple lineare Regression
So interpretieren Sie partielle Regressionskoeffizienten