De constante variantiehypothese: definitie en voorbeeld


Lineaire regressie is een techniek die we gebruiken om de relatie tussen een of meer voorspellende variabelen en eenresponsvariabele te kwantificeren.

Een van de belangrijkste aannames van lineaire regressie is dat de residuen een constante variantie hebben op elk niveau van de voorspellende variabele(n).

Als deze aanname niet wordt geverifieerd, zouden de residuen lijden aan heteroscedasticiteit . Wanneer dit gebeurt, worden de schattingen van de modelcoëfficiënten onbetrouwbaar.

Hoe constante variantie te evalueren

De meest gebruikelijke manier om te bepalen of de residuen van een regressiemodel een constante variantie hebben, is door een grafiek van de gepaste waarden tegen de residuen te maken.

Dit is een type plot dat de aangepaste waarden van het regressiemodel langs de x-as en de residuen van die waarden langs de y-as weergeeft.

Als de verdeling van de residuen ongeveer gelijk is op elk niveau van de aangepaste waarden, zeggen we dat aan de aanname van constante variantie is voldaan.

Anders wordt deze aanname waarschijnlijk geschonden als de verspreiding van residuen systematisch toeneemt of afneemt.

Opmerking : dit type plot kan alleen worden gemaakt nadat een regressiemodel aan de gegevensset is aangepast.

De volgende grafiek toont een voorbeeld van een grafiek van aangepaste waarden versus residuen die een constante variantie weergeeft:

Merk op hoe de residuen willekeurig rond nul verspreid zijn, in geen bepaald patroon, met een ongeveer constante variantie op elk niveau van de aangepaste waarden.

De volgende grafiek toont een voorbeeld van een grafiek van aangepaste waarden versus residuen die een niet-constante variantie weergeeft:

Merk op dat de verdeling van de residuen groter wordt naarmate de aangepaste waarden toenemen. Dit is een typisch teken van niet-constante variantie.

Dit vertelt ons dat ons regressiemodel lijdt onder niet-constante variantie in de residuen en dat de schattingen van de modelcoëfficiënten daarom onbetrouwbaar zijn.

Hoe u een schending van de constante variantie kunt oplossen

Als de aanname van constante variantie wordt geschonden, is de meest gebruikelijke manier om dit probleem op te lossen het transformeren van de responsvariabele met behulp van een van de volgende drie transformaties:

1. Logboektransformatie: transformeer de antwoordvariabele van y naar log(y)

2. Vierkantsworteltransformatie: transformeer de responsvariabele van y naar √y

3. Derdemachtsworteltransformatie: transformeer de responsvariabele van y naar y 1/3

Door deze transformaties uit te voeren verdwijnt het probleem van niet-constante variantie doorgaans.

Aanvullende bronnen

De volgende tutorials bieden aanvullende informatie over lineaire regressie en restanalyse:

Inleiding tot eenvoudige lineaire regressie
Inleiding tot meervoudige lineaire regressie
De vier aannames van lineaire regressie
Wat zijn residuen in de statistiek?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert