Jak utworzyć częściowe działki rezydualne w r


Wielokrotna regresja liniowa to metoda statystyczna, którą możemy wykorzystać do zrozumienia związku między wieloma zmiennymi predykcyjnymi azmienną odpowiedzi .

Jednakże jednym z kluczowych założeń wielokrotnej regresji liniowej jest to, że istnieje liniowa zależność pomiędzy każdą zmienną predykcyjną a zmienną odpowiedzi.

Jeżeli to założenie nie zostanie spełnione, wyniki modelu regresji mogą nie być wiarygodne.

Jednym ze sposobów sprawdzenia tego założenia jest utworzenie wykresu reszt cząstkowych , który przedstawia reszty zmiennej predykcyjnej w stosunku do zmiennej odpowiedzi.

Poniższy przykład pokazuje, jak utworzyć częściowe wykresy reszt dla modelu regresji w R.

Przykład: Jak utworzyć częściowe wykresy resztowe w R

Załóżmy, że dopasowujemy model regresji z trzema zmiennymi predykcyjnymi w R:

 #make this example reproducible
set. seeds (0)

#define response variable
y <- c(1:1000)

#define three predictor variables
x1 <- c(1:1000)*runif(n=1000)
x2 <- (c(1:1000)*rnorm(n=1000))^2
x3 <- (c(1:1000)*rnorm(n=1000))^3

#fit multiple linear regression model
model <- lm(y~x1+x2+x3))

Możemy użyć funkcji crPlots() z pakietu car w R, aby utworzyć częściowe wykresy reszt dla każdej zmiennej predykcyjnej w modelu:

 library (car)

#create partial residual plots
crPlots(model)

częściowe działki rezydualne w R

Niebieska linia pokazuje oczekiwane reszty, jeśli związek między predyktorem a zmienną odpowiedzi był liniowy. Różowa linia pokazuje rzeczywiste pozostałości.

Jeżeli te dwie linie znacznie się różnią, oznacza to, że istnieje zależność nieliniowa.

Z powyższych wykresów widać, że reszty dla x2 i x3 wydają się nieliniowe.

Narusza to założenie liniowości wielokrotnej regresji liniowej. Jednym ze sposobów rozwiązania tego problemu jest użycie transformacji pierwiastka kwadratowego lub sześciennego na zmiennych predykcyjnych:

 library (car)

#fit new model with transformed predictor variables
model_transformed <- lm(y~x1+sqrt(x2)+log10(x3^(1/3)))

#create partial residual plots for new model
crPlots(model_transformed)

Z częściowych wykresów reszt możemy zobaczyć, że x2 ma teraz bardziej liniową zależność ze zmienną odpowiedzi.

Zmienna predykcyjna x3 jest nadal nieco nieliniowa, więc możemy zdecydować się na kolejną transformację lub ewentualnie całkowicie usunąć zmienną z modelu.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak tworzyć inne typowe wykresy w R:

Jak tworzyć wykresy diagnostyczne w R
Jak utworzyć skalę i wykres lokalizacji w R
Jak utworzyć wykres rezydualny w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *