Hoe maak je een restplot in r


Residuele plots worden vaak gebruikt om te beoordelen of de residuen uit een regressieanalyse normaal verdeeld zijn en of ze al dan niet heteroscedasticiteit vertonen.

In deze tutorial wordt uitgelegd hoe u residuele plots maakt voor een regressiemodel in R.

Voorbeeld: Residuele plots in R

In dit voorbeeld passen we een regressiemodel aan met behulp van de ingebouwde R-dataset van mtcars en produceren we vervolgens drie verschillende residuele plots om de residuen te analyseren.

Stap 1: Pas het regressiemodel aan.

Eerst passen we een regressiemodel aan met mpg als responsvariabele en disp en hp als verklarende variabelen:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Stap 2: Maak een rest- of aangepast plot.

Vervolgens zullen we een residuele/fitted plot produceren, nuttig voor het visueel detecteren van heteroskedasticiteit – bijvoorbeeld een systematische verandering in de verdeling van residuen over een bereik van waarden.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Resterend of aangepast terrein in R

Op de x-as worden de gefitte waarden weergegeven en op de y-as de residuen. Uit de grafiek kunnen we zien dat de verdeling van de residuen doorgaans hoger is voor hoger passende waarden, maar dit lijkt niet ernstig genoeg dat we wijzigingen in het model moeten aanbrengen.

Stap 3: Maak een QQ-plot.

We kunnen ook een QQ-plot maken, handig om te bepalen of de residuen een normale verdeling volgen. Als de gegevenswaarden in de grafiek een ruwweg rechte lijn volgen in een hoek van 45 graden, zijn de gegevens normaal verdeeld.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

Residuele Q-Q-plot in R

We kunnen zien dat de residuen de neiging hebben iets af te wijken van de lijn nabij de staarten, wat erop zou kunnen wijzen dat ze niet normaal verdeeld zijn.

Stap 4: Maak een dichtheidsplot.

We kunnen ook een dichtheidsplot maken, wat ook handig is om visueel te controleren of de residuen normaal verdeeld zijn of niet. Als de plot grofweg klokvormig is, volgen de residuen waarschijnlijk een normale verdeling.

 #Create density plot of residuals
plot(density(res))

Residuele dichtheidscurve in R

We kunnen zien dat de dichtheidsgrafiek grofweg de vorm van een klok volgt, hoewel deze enigszins naar rechts is gekanteld. Afhankelijk van het type onderzoek kan een onderzoeker wel of niet besluiten een transformatie op de gegevens uit te voeren om ervoor te zorgen dat de residuen normaler verdeeld zijn.

Aanvullende bronnen

Hoe gestandaardiseerde residuen in R te berekenen
Hoe gestudentiseerde residuen in R te berekenen
Hoe maak je een histogram van residuen in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert