Was ist ein partieller f-test?

Von Dr. Benjamin Anderson Juli 27, 2023 Führung Keine Kommentare

Mithilfe eines partiellen F-Tests wird ermittelt, ob ein statistisch signifikanter Unterschied zwischen einem Regressionsmodell und einer verschachtelten Version desselben Modells besteht.

Ein verschachteltes Modell ist einfach ein Modell, das eine Teilmenge von Prädiktorvariablen im gesamten Regressionsmodell enthält.

Angenommen, wir haben das folgende Regressionsmodell mit vier Prädiktorvariablen:

Y = β ₀ + β ₁ x ₁ + β ₂ x ₂ + β ₃ x ₃ + β ₄ x ₄ + ε

Ein Beispiel für ein verschachteltes Modell wäre das folgende Modell mit nur zwei der ursprünglichen Prädiktorvariablen:

Y = β ₀ + β ₁ x ₁ + β ₂ x ₂ + ε

Um festzustellen, ob sich diese beiden Modelle signifikant unterscheiden, können wir einen partiellen F-Test durchführen.

Teil-F-Test: die Grundlagen

Ein partieller F-Test berechnet die folgende F-Test-Statistik:

F = (( _Reduzierter RSS – _{Vollständiger} RSS)/p) / ( _{Vollständiger} RSS /nk)

Gold:

_Reduzierter RSS : Die verbleibende Quadratsumme des reduzierten (dh „verschachtelten“) Modells.
RSS _full : Die verbleibende Quadratsumme des vollständigen Modells.
p: Anzahl der aus dem vollständigen Modell entfernten Prädiktoren.
n: die Gesamtzahl der Beobachtungen im Datensatz.
k: Die Anzahl der Koeffizienten (einschließlich des Achsenabschnitts) im vollständigen Modell.

Beachten Sie, dass die Restquadratsumme für das Gesamtmodell immer kleiner sein wird, da das Hinzufügen von Prädiktoren immer zu einer gewissen Fehlerreduzierung führt.

Ein partieller F-Test testet also im Wesentlichen, ob die Gruppe von Prädiktoren, die Sie aus dem Gesamtmodell entfernt haben, tatsächlich nützlich ist und in das Gesamtmodell einbezogen werden sollte.

Dieser Test verwendet die folgenden Null- und Alternativhypothesen:

H ₀ : Alle aus dem vollständigen Modell entfernten Koeffizienten sind Null.

H _A : Mindestens einer der aus dem vollständigen Modell entfernten Koeffizienten ist ungleich Null.

Wenn der der F-Test-Statistik entsprechende p-Wert unter einem bestimmten Signifikanzniveau (z. B. 0,05) liegt, können wir die Nullhypothese ablehnen und daraus schließen, dass mindestens einer der aus dem vollständigen Modell entfernten Koeffizienten signifikant ist.

Teil-F-Test: ein Beispiel

In der Praxis verwenden wir die folgenden Schritte, um einen partiellen F-Test durchzuführen:

1. Passen Sie das vollständige Regressionsmodell an und berechnen Sie RSS _full .

2. Passen Sie das verschachtelte Regressionsmodell an und berechnen Sie _{den reduzierten} RSS.

3. Führen Sie eine ANOVA durch, um das vollständige und das reduzierte Modell zu vergleichen. Dadurch wird die F-Test-Statistik erstellt, die zum Vergleich der Modelle erforderlich ist.

Der folgende Code zeigt beispielsweise, wie die folgenden zwei Regressionsmodelle in R mithilfe von Daten aus dem integrierten mtcars -Datensatz angepasst werden:

Vollständiges Modell: mpg = β ₀ + β ₁ verfügbar + β ₂ Vergaser + β ₃ PS + β ₄ Zyl

Modell: mpg = β ₀ + β ₁ verfügbar + β ₂ Kohlenhydrate

 #fit full model
model_full <- lm(mpg ~ disp + carb + hp + cyl, data = mtcars)

#fit reduced model
model_reduced <- lm(mpg ~ disp + carb, data = mtcars)

#perform ANOVA to test for differences in models
anova(model_reduced, model_full)

Analysis of Variance Table

Model 1: mpg ~ available + carb
Model 2: mpg ~ disp + carb + hp + cyl
  Res.Df RSS Df Sum of Sq F Pr(>F)
1 29 254.82                           
2 27 238.71 2 16.113 0.9113 0.414

Aus dem Ergebnis können wir ersehen, dass die F-Teststatistik der ANOVA 0,9113 und der entsprechende p-Wert 0,414 beträgt.

Da dieser p-Wert nicht kleiner als 0,05 ist, können wir die Nullhypothese nicht ablehnen. Das bedeutet, dass wir nicht über genügend Beweise verfügen, um zu sagen, dass eine der Prädiktorvariablen hp oder cyl statistisch signifikant ist.

Mit anderen Worten: Das Hinzufügen von hp und cyl zum Regressionsmodell verbessert die Modellanpassung nicht wesentlich.

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen

Teil-F-Test: die Grundlagen

Teil-F-Test: ein Beispiel

Über den Autor

Dr. Benjamin Anderson

Einen Kommentar hinzufügen