Hoe te testen op multicollineariteit in spss


Multicollineariteit bij regressieanalyse treedt op wanneer twee of meer voorspellende variabelen sterk met elkaar gecorreleerd zijn, zodat ze geen unieke of onafhankelijke informatie verschaffen in het regressiemodel. Als de mate van correlatie tussen variabelen hoog genoeg is, kan dit problemen veroorzaken bij het aanpassen en interpreteren van het regressiemodel.

Eén manier om multicollineariteit te detecteren is door een metriek te gebruiken die bekend staat als de variantie-inflatiefactor (VIF) , die de correlatie en sterkte van de correlatie tussen voorspellende variabelen in een regressiemodel meet.

In deze tutorial wordt uitgelegd hoe u VIF kunt gebruiken om multicollineariteit te detecteren in regressieanalyse in SPSS.

Voorbeeld: multicollineariteit in SPSS

Stel dat we de volgende dataset hebben die de examenscore van 10 studenten weergeeft, samen met het aantal uren dat ze aan studeren hebben besteed, het aantal oefenexamens dat ze hebben afgelegd en hun huidige cijfer in de cursus:

We willen graag een lineaire regressie uitvoeren met score als responsvariabele en hours , prep_exams en current_grade als voorspellende variabelen, maar we willen er zeker van zijn dat de drie voorspellende variabelen niet sterk gecorreleerd zijn.

Om te bepalen of multicollineariteit een probleem is, kunnen we VIF-waarden produceren voor elk van de voorspellende variabelen.

Om dit te doen, klikt u op het tabblad Analyseren , vervolgens op Regressie en vervolgens op Lineair :

In het nieuwe venster dat verschijnt, sleept u de score naar het vak met de naam Dependent en sleept u de drie voorspellende variabelen naar het vak met de naam Independent(s). Klik vervolgens op Statistieken en zorg ervoor dat het vakje naast Collinearity Diagnostics is aangevinkt. Klik vervolgens op Doorgaan . Klik vervolgens op OK .

Nadat u op OK hebt geklikt, verschijnt de volgende tabel met de VIF-waarde voor elke voorspellende variabele:

VIF in SPSS

De VIF-waarden voor elk van de voorspellende variabelen zijn als volgt:

  • uren: 1.169
  • voorbereidingsexamens: 1.403
  • huidige_score: 1.522

De VIF-waarde begint bij 1 en heeft geen bovengrens. Een algemene regel voor het interpreteren van VIF’s is:

  • Een waarde van 1 geeft aan dat er geen correlatie bestaat tussen een bepaalde voorspellende variabele en enige andere voorspellende variabele in het model.
  • Een waarde tussen 1 en 5 duidt op een gematigde correlatie tussen een bepaalde voorspellende variabele en andere voorspellende variabelen in het model, maar deze is vaak niet ernstig genoeg om speciale aandacht te vereisen.
  • Een waarde groter dan 5 duidt op een potentieel ernstige correlatie tussen een bepaalde voorspellende variabele en andere voorspellende variabelen in het model. In dit geval zijn de coëfficiëntschattingen en p-waarden in de regressieresultaten waarschijnlijk onbetrouwbaar.

We kunnen zien dat geen van de VIF-waarden voor de voorspellende variabelen in dit voorbeeld groter is dan 5, wat aangeeft dat multicollineariteit geen probleem zal zijn in het regressiemodel.

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert