Як створити графік залишків у ggplot2 (з прикладом)


Графіки залишків використовуються для оцінки того, чи нормально розподілені залишки регресійної моделі та чи є вони гетероскедастичними .

Щоб створити діаграму залишків у ggplot2, ви можете використовувати наступний базовий синтаксис:

 library (ggplot2)

ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 )

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: створення залишкового графіка в ggplot2

Для цього прикладу ми використаємо набір даних mtcars , вбудований у R:

 #view first six rows of mtcars dataset
head(mtcars)
                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

Спочатку ми підберемо регресійну модель, використовуючи mpg як змінну відповіді та qsec як змінну предиктора:

 #fit regression model
model <- lm(mpg ~ qsec, data=mtcars)

Далі ми використаємо наступний синтаксис для створення залишкового графіка в ggplot2:

 library (ggplot2)

#create residual plot
ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 ) 

ділянка залишків у ggplot2

На осі абсцис відображаються підібрані значення, а на осі у – залишки.

Залишки, здається, випадково розкидані навколо нуля без чіткої моделі, що вказує на те, що припущення гомоскедастичності виконано.

Іншими словами, коефіцієнти регресійної моделі мають бути надійними, і нам не потрібно виконувати будь-які перетворення даних.

Також зауважте, що ми можемо використовувати функцію labs() , щоб додати заголовок і мітки осі до залишкового графіка:

 library (ggplot2)

#create residual plot with title and axis labels
ggplot(model, aes(x = .fitted, y = .resid)) +
  geom_point() +
  geom_hline(yintercept = 0 ) +
  labs(title=' Residual vs. Fitted Values Plot ', x=' Fitted Values ', y=' Residuals ') 

ggplot2 відображення залишків у порівнянні зі встановленими значеннями з мітками осей

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як обчислити стандартизовані залишки в R
Як обчислити студентські залишки в R
Як створити гістограму залишків у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *