So berechnen sie den vif in excel


Multikollinearität in der Regressionsanalyse tritt auf, wenn zwei oder mehr erklärende Variablen stark miteinander korrelieren, sodass sie im Regressionsmodell keine eindeutigen oder unabhängigen Informationen liefern. Wenn der Korrelationsgrad zwischen den Variablen hoch genug ist, kann dies zu Problemen bei der Anpassung und Interpretation des Regressionsmodells führen.

Glücklicherweise ist es möglich, Multikollinearität mithilfe einer Metrik namens Varianzinflationsfaktor (VIF) zu erkennen, die die Korrelation und Stärke der Korrelation zwischen erklärenden Variablen in einem Regressionsmodell misst.

In diesem Tutorial wird erläutert, wie Sie den VIF in Excel berechnen.

Beispiel: Berechnung des VIF in Excel

In diesem Beispiel führen wir eine multiple lineare Regression mit dem folgenden Datensatz durch, der die Attribute von 10 Basketballspielern beschreibt. Wir werden ein Regressionsmodell anpassen, das die Bewertung als Antwortvariable und Punkte, Assists und Rebounds als erklärende Variablen verwendet. Als nächstes identifizieren wir die VIF-Werte für jede erklärende Variable.

Rohdaten in Excel

Schritt 1: Führen Sie eine multiple lineare Regression durch.

Gehen Sie im oberen Menüband zur Registerkarte „Daten“ und klicken Sie auf „Datenanalyse“. Wenn diese Option nicht angezeigt wird, müssen Sie zunächst die kostenlose Analysis ToolPak-Software installieren .

Datenanalyse-Toolpak in Excel

Sobald Sie auf Datenanalyse klicken, erscheint ein neues Fenster. Wählen Sie Regression und klicken Sie auf OK.

Regression mit Data Analysis Toolpak in Excel

Füllen Sie die erforderlichen Tabellen für die Antwortvariablen und erklärenden Variablen aus und klicken Sie dann auf OK.

Multiple Regression in Excel

Dies führt zu folgendem Ergebnis:

Regressionsausgabe in Excel

Schritt 2: Berechnen Sie den VIF für jede erklärende Variable.

Als nächstes können wir den VIF für jede der drei erklärenden Variablen berechnen, indem wir individuelle Regressionen durchführen, wobei wir eine erklärende Variable als Antwortvariable und die anderen beiden als erklärende Variablen verwenden.

Beispielsweise können wir den VIF für die Punktevariable berechnen, indem wir eine multiple lineare Regression durchführen, wobei wir Punkte als Antwortvariable und Assists und Rebounds als erklärende Variablen verwenden.

Dies führt zu folgendem Ergebnis:

Berechnen Sie den VIF in Excel

Der VIF für Punkte wird wie folgt berechnet: 1 / (1 – R-Quadrat) = 1 / (1 – .433099) = 1,76 .

Wir können diesen Vorgang dann für die anderen beiden Variablen, Assists und Rebounds, wiederholen.

Es stellt sich heraus, dass die VIFs für die drei erklärenden Variablen wie folgt lauten:

Punkte: 1,76
Vorlagen: 1,96
Rebounds: 1,18

So interpretieren Sie VIF-Werte

Der VIF-Wert beginnt bei 1 und hat keine Obergrenze. Eine allgemeine Regel für die Interpretation von VIFs lautet:

  • Ein Wert von 1 gibt an, dass keine Korrelation zwischen einer bestimmten erklärenden Variablen und einer anderen erklärenden Variablen im Modell besteht.
  • Ein Wert zwischen 1 und 5 weist auf eine mäßige Korrelation zwischen einer bestimmten erklärenden Variablen und anderen erklärenden Variablen im Modell hin, ist jedoch oft nicht schwerwiegend genug, um besondere Aufmerksamkeit zu erfordern.
  • Ein Wert größer als 5 weist auf eine potenziell schwerwiegende Korrelation zwischen einer bestimmten erklärenden Variablen und anderen erklärenden Variablen im Modell hin. In diesem Fall sind die Koeffizientenschätzungen und p-Werte in den Regressionsergebnissen wahrscheinlich unzuverlässig.

Da jeder der VIF-Werte der erklärenden Variablen in unserem Regressionsmodell nahe bei 1 liegt, ist Multikollinearität in unserem Beispiel kein Problem.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert