Jak utworzyć wykres rezydualny w r


Wykresy reszt są często wykorzystywane do oceny, czy reszty z analizy regresji mają rozkład normalny i czy wykazują heteroskedastyczność .

W tym samouczku wyjaśniono, jak utworzyć wykresy reszt dla modelu regresji w języku R.

Przykład: Pozostałe działki w R

W tym przykładzie dopasujemy model regresji, korzystając z wbudowanego zbioru danych R mtcars , a następnie utworzymy trzy różne wykresy reszt w celu analizy reszt.

Krok 1: Dopasuj model regresji.

Najpierw dopasujemy model regresji, używając mpg jako zmiennej odpowiedzi oraz disp i hp jako zmiennych objaśniających:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Krok 2: Utwórz wykres resztkowy lub skorygowany.

Następnie utworzymy wykres reszt/dopasowany, przydatny do wizualnego wykrywania heteroskedastyczności – na przykład systematycznej zmiany rozkładu reszt w pewnym zakresie wartości.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Pozostały lub skorygowany teren w R

Oś x wyświetla dopasowane wartości, a oś y wyświetla reszty. Z wykresu widać, że rozkład reszt jest zwykle wyższy w przypadku wyższych dopasowanych wartości, ale nie wydaje się to na tyle poważne, abyśmy musieli wprowadzać zmiany w modelu.

Krok 3: Stwórz wykres QQ.

Możemy również utworzyć wykres QQ, przydatny do określenia, czy reszty mają rozkład normalny. Jeśli wartości danych na wykresie przebiegają mniej więcej po linii prostej pod kątem 45 stopni, wówczas dane mają rozkład normalny.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

Resztkowy wykres Q-Q w R

Widzimy, że reszty mają tendencję do niewielkiego odchylenia od linii w pobliżu ogonów, co może wskazywać, że nie mają one rozkładu normalnego.

Krok 4: Stwórz wykres gęstości.

Możemy również utworzyć wykres gęstości, który jest również przydatny do wizualnego sprawdzenia, czy reszty mają rozkład normalny, czy nie. Jeśli wykres ma kształt zbliżony do dzwonu, reszty prawdopodobnie mają rozkład normalny.

 #Create density plot of residuals
plot(density(res))

Krzywa gęstości resztkowej w R

Widzimy, że wykres gęstości ma z grubsza kształt dzwonu, chociaż jest lekko nachylony w prawo. W zależności od rodzaju badania badacz może zdecydować się na przekształcenie danych lub nie, aby zapewnić bardziej normalny rozkład reszt.

Dodatkowe zasoby

Jak obliczyć reszty standaryzowane w R
Jak obliczyć studentyzowane reszty w R
Jak utworzyć histogram reszt w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *