Hoe u met de hand een restpad kunt maken


Een residuele plot is een type plot dat de waarden van een voorspellende variabele in een regressiemodel langs de x-as en de waarden van de residuen langs de y-as weergeeft.

Deze plot wordt gebruikt om te evalueren of de residuen van een regressiemodel normaal verdeeld zijn en of ze al dan niet heteroscedasticiteit vertonen.

Het volgende stapsgewijze voorbeeld laat zien hoe u handmatig een residuele plot voor een regressiemodel kunt maken.

Stap 1: Zoek de voorspelde waarden

Stel dat we een regressiemodel willen aanpassen aan de volgende gegevensset:

Met behulp van statistische software (zoals Excel, R, Python, SPSS, enz.) kunnen we zien dat het gepaste regressiemodel:

y = 10,4486 + 1,3037(x)

We kunnen dit model vervolgens gebruiken om de waarde van y te voorspellen, gebaseerd op de waarde van x. Als x = 3, voorspellen we bijvoorbeeld dat y zal zijn:

y = 10,4486 + 1,3037(3) = 14,359

We kunnen dit proces herhalen voor elke waarneming in onze dataset:

Stap 2: Zoek de residuen

Een residu voor een bepaalde waarneming in onze dataset wordt als volgt berekend:

Residu = waargenomen waarde – voorspelde waarde

Het residu van de eerste waarneming zou bijvoorbeeld als volgt worden berekend:

Residu = 15 – 14,359 = 0,641

We kunnen dit proces herhalen voor elke waarneming in onze dataset:

Stap 3: Maak het restplot

Ten slotte kunnen we een residuele grafiek maken door de x-waarden langs de x-as en de residuen langs de y-as te plaatsen.

Het eerste punt dat we in onze grafiek plaatsen is bijvoorbeeld (3, 0,641)

Het volgende punt dat we in onze grafiek zullen plaatsen is (5, 0,033)

We gaan door totdat we alle 10 paarsgewijze combinaties van x-waarden en residuen in de grafiek hebben geplaatst:

Elk punt boven nul in de grafiek vertegenwoordigt een positief residu. Dit betekent dat de waargenomen waarde voor y groter is dan de waarde voorspeld door het regressiemodel.

Elk punt kleiner dan nul vertegenwoordigt een negatief residu. Dit betekent dat de waargenomen waarde voor y lager is dan de waarde voorspeld door het regressiemodel.

Met de hand gecreëerd restterrein

Omdat de punten in de grafiek willekeurig verspreid zijn rond een residu van 0 zonder duidelijk patroon, geeft dit aan dat de relatie tussen x en y lineair is en dat het passend is om een lineair regressiemodel te gebruiken.

En aangezien de residuen niet systematisch toenemen of afnemen naarmate de voorspellende variabele toeneemt, betekent dit dat heteroscedasticiteit geen probleem is met dit regressiemodel.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u restplots kunt maken met behulp van verschillende statistische software:

Hoe maak je een resterend plot op een TI-84-rekenmachine?
Hoe u een restplot in Excel maakt
Hoe maak je een restplot in R
Hoe u een restplot maakt in Python

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert