Was ist ein verschachteltes modell? (definition & #038; beispiel)


Ein verschachteltes Modell ist einfach ein Regressionsmodell , das eine Teilmenge von Prädiktorvariablen in einem anderen Regressionsmodell enthält.

Angenommen, wir haben das folgende Regressionsmodell (nennen wir es Modell A), das die Anzahl der von einem Basketballspieler erzielten Punkte auf der Grundlage von vier Prädiktorvariablen vorhersagt:

Punkte = β 0 + β 1 (Minuten) + β 2 (Höhe) + β 3 (Position) + β 4 (Schüsse) + ε

Ein Beispiel für ein verschachteltes Modell (nennen wir es Modell B) wäre das folgende Modell mit nur zwei der Prädiktorvariablen aus Modell A:

Punkte = β 0 + β 1 (Minuten) + β 2 (Höhe) + ε

Wir würden sagen, dass Modell B in Modell A verschachtelt ist, da Modell B eine Teilmenge der Prädiktorvariablen von Modell A enthält.

Überlegen Sie jedoch, ob wir ein anderes Modell hätten (nennen wir es Modell C), das drei Prädiktorvariablen enthält:

Punkte = β 0 + β 1 (Minuten) + β 2 (Höhe) + β 3 (Freiwurfversuche)

Wir würden nicht sagen, dass Modell C in Modell A verschachtelt ist, da jedes Modell Prädiktorvariablen enthält, die das andere Modell nicht enthält.

Die Bedeutung verschachtelter Modelle

In der Praxis verwenden wir häufig verschachtelte Modelle, wenn wir wissen möchten, ob ein Modell mit einem vollständigen Satz von Prädiktorvariablen besser zu einem Datensatz passt als ein Modell mit einer Teilmenge dieser Prädiktorvariablen.

Im obigen Szenario könnten wir beispielsweise ein umfassendes Modell anhand der gespielten Minuten, der Höhe, der Position und der versuchten Schüsse anpassen, um die Anzahl der von Basketballspielern erzielten Punkte vorherzusagen.

Wir könnten jedoch vermuten, dass die Position und die versuchten Schüsse möglicherweise keine sehr guten Vorhersagen über die erzielten Punkte treffen.

Daher könnten wir ein verschachteltes Modell anpassen, das nur gespielte Minuten und Tonhöhe verwendet, um erzielte Punkte vorherzusagen.

Anschließend können wir die beiden Modelle vergleichen, um festzustellen, ob ein statistisch signifikanter Unterschied besteht.

Wenn es keinen signifikanten Unterschied zwischen den Modellen gibt, können wir Position und Schussversuche als Prädiktorvariablen entfernen, da sie das Modell nicht wesentlich verbessern.

So analysieren Sie verschachtelte Modelle

Um festzustellen, ob sich ein verschachteltes Modell erheblich von einem „vollständigen“ Modell unterscheidet, führen wir normalerweise einen Likelihood-Ratio-Test durch, der die folgenden Null- und Alternativhypothesen verwendet:

H 0 : Das vollständige Modell und das verschachtelte Modell passen gleich gut zu den Daten. Sie sollten also ein verschachteltes Modell verwenden .

H A : Das vollständige Modell passt deutlich besser zu den Daten als das verschachtelte Modell. Sie müssen also die vollständige Vorlage verwenden .

Ein Likelihood-Ratio-Test erzeugt eine Chi-Quadrat-Teststatistik und den entsprechenden p-Wert.

Wenn der p-Wert des Tests unter einem bestimmten Signifikanzniveau liegt (z. B. 0,05), können wir die Nullhypothese ablehnen und daraus schließen, dass das vollständige Modell eine deutlich bessere Anpassung bietet.

In den folgenden Tutorials wird erläutert, wie Sie einen Likelihood-Ratio-Test mit R und Python durchführen:

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert