Jak utworzyć wykres resztowy w ggplot2 (z przykładem)


Wykresy reszt służą do oceny, czy reszty modelu regresji mają rozkład normalny i czy wykazują heteroskedastyczność .

Aby utworzyć wykres rezydualny w ggplot2, możesz użyć następującej podstawowej składni:

 library (ggplot2)

ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 )

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: tworzenie wykresu resztowego w ggplot2

W tym przykładzie użyjemy zestawu danych mtcars wbudowanego w R:

 #view first six rows of mtcars dataset
head(mtcars)
                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

Najpierw dopasujemy model regresji, używając mpg jako zmiennej odpowiedzi i qsec jako zmiennej predykcyjnej:

 #fit regression model
model <- lm(mpg ~ qsec, data=mtcars)

Następnie użyjemy następującej składni, aby utworzyć wykres rezydualny w ggplot2:

 library (ggplot2)

#create residual plot
ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 ) 

wykres resztowy w ggplot2

Oś x wyświetla dopasowane wartości, a oś y wyświetla reszty.

Reszty wydają się być losowo rozproszone wokół zera, bez wyraźnego wzoru, co wskazuje, że założenie homoskedastyczności jest spełnione.

Innymi słowy, współczynniki modelu regresji powinny być wiarygodne i nie trzeba dokonywać żadnych transformacji danych.

Zauważ też, że możemy użyć funkcji labs() , aby dodać tytuł i etykiety osi do wykresu rezydualnego:

 library (ggplot2)

#create residual plot with title and axis labels
ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 ) +
  labs(title=' Residual vs. Fitted Values Plot ', x=' Fitted Values ', y=' Residuals ') 

ggplot2 wykreśla reszty w porównaniu z dopasowanymi wartościami z etykietami osi

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak obliczyć reszty standaryzowane w R
Jak obliczyć studentyzowane reszty w R
Jak utworzyć histogram reszt w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *