Excel: so interpretieren sie p-werte in der regressionsausgabe
Mithilfe der multiplen linearen Regression wird die Beziehung zwischen zwei oder mehr Prädiktorvariablen und einer Antwortvariablen quantifiziert.
Wenn wir eine multiple lineare Regression durchführen, sind wir immer an den p-Werten im Ergebnis interessiert, um zu bestimmen, ob die Beziehung zwischen den Prädiktorvariablen und der Antwortvariablen statistisch signifikant ist.
In diesem Tutorial wird erläutert, wie p-Werte in der Ausgabe eines multiplen linearen Regressionsmodells in Excel interpretiert werden.
Beispiel: Interpretieren von P-Werten in der Regressionsausgabe in Excel
Angenommen, wir möchten wissen, ob die Anzahl der Lernstunden und die Anzahl der abgelegten Vorbereitungsprüfungen die Note beeinflussen, die ein Student bei einer bestimmten Hochschulaufnahmeprüfung erhält.
Um diesen Zusammenhang zu untersuchen, können wir eine multiple lineare Regression durchführen, indem wir die untersuchten Stunden und vorbereitenden Prüfungen als Prädiktorvariablen und die Prüfungsergebnisse als Antwortvariable verwenden.
Der folgende Screenshot zeigt die Regressionsausgabe dieses Modells in Excel:
Es gibt drei p-Werte, die wir im Ergebnis betrachten sollten:
- P-Wert des Gesamtmodells
- P-Wert der ersten Prädiktorvariablen (Stunden)
- P-Wert der zweiten Prädiktorvariablen (Vorprüfungen)
So interpretieren Sie jeden p-Wert:
P-Wert des Gesamtmodells
Der p-Wert für das Gesamtmodell ist in der Spalte mit der Bezeichnung „F-Signifikanz“ im Ergebnis zu finden.
Wir können sehen, dass dieser p-Wert 0,00 beträgt.
Da dieser Wert unter 0,05 liegt, können wir daraus schließen, dass das Regressionsmodell insgesamt statistisch signifikant ist.
Mit anderen Worten: Die Kombination aus Lernstunden und abgelegten Vorbereitungsprüfungen hat einen statistisch signifikanten Zusammenhang mit der Abschlussnote der Prüfung.
P-Wert der ersten Prädiktorvariablen (Stunden)
Der p-Wert für die erste Prädiktorvariable, Stunden, beträgt 0,00.
Da dieser Wert unter 0,05 liegt, können wir daraus schließen, dass die untersuchten Stunden statistisch signifikant sind.
Mit anderen Worten: Die Anzahl der Stunden, die ein Student studiert, steht in einem statistisch signifikanten Zusammenhang mit der Abschlussnote der Prüfung.
P-Wert der zweiten Prädiktorvariablen (Vorprüfungen)
Der p-Wert für die zweite Prädiktorvariable, Vorbereitungsprüfungen, beträgt 0,52.
Da dieser Wert nicht unter 0,05 liegt, können wir daraus schließen, dass die Anzahl der abgelegten Vorbereitungsprüfungen statistisch nicht signifikant ist.
Mit anderen Worten: Die Anzahl der Vorbereitungsprüfungen, die ein Student ablegt, steht in keinem statistisch signifikanten Zusammenhang mit der Note, die er in der Abschlussprüfung erhält.
Da diese Variable statistisch nicht signifikant ist, können wir uns dazu entschließen, sie aus dem Modell zu entfernen, da sie keine signifikante Verbesserung des Gesamtmodells mit sich bringt.
In diesem Fall könnten wir eine einfache lineare Regression durchführen und dabei nur die untersuchten Stunden als Prädiktorvariable verwenden.
Zusätzliche Ressourcen
In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in Excel ausführen:
So führen Sie eine einfache lineare Regression in Excel durch
So führen Sie eine multiple lineare Regression in Excel durch
So führen Sie eine Polynomregression in Excel durch