Як створити ділянку залишків у r
Діаграми залишків часто використовуються для оцінки того, чи є залишки регресійного аналізу нормально розподіленими та чи демонструють вони гетероскедастичність .
У цьому посібнику пояснюється, як створити графіки залишків для регресійної моделі в R.
Приклад: залишкові ділянки в R
У цьому прикладі ми підберемо регресійну модель за допомогою вбудованого набору даних R mtcars , а потім створимо три різні залишкові графіки для аналізу залишків.
Крок 1. Підберіть регресійну модель.
По-перше, ми підберемо регресійну модель, використовуючи mpg як змінну відповіді та disp і hp як пояснювальні змінні:
#load the dataset data(mtcars) #fit a regression model model <- lm(mpg~disp+hp, data=mtcars) #get list of residuals res <- resid(model)
Крок 2: створіть залишковий або скоригований графік.
Далі ми створимо залишковий/підігнаний графік, корисний для візуального виявлення гетероскедастичності – наприклад, систематичної зміни в розподілі залишків у діапазоні значень.
#produce residual vs. fitted plot plot(fitted(model), res) #add a horizontal line at 0 abline(0,0)
На осі абсцис відображаються підібрані значення, а на осі у – залишки. З графіка ми бачимо, що розподіл залишків має тенденцію бути вищим для вищих підігнаних значень, але це не здається настільки серйозним, щоб нам потрібно було вносити зміни в модель.
Крок 3: створіть графік QQ.
Ми також можемо побудувати графік QQ, корисний для визначення того, чи відповідають залишки нормальному розподілу. Якщо значення даних на графіку йдуть по приблизно прямій лінії під кутом 45 градусів, то дані розподіляються нормально.
#create QQ plot for residuals qqnorm(res) #add a straight diagonal line to the plot qqline(res)
Ми бачимо, що залишки, як правило, трохи відхиляються від лінії біля хвостів, що може вказувати на те, що вони розподілені ненормально.
Крок 4. Створіть графік щільності.
Ми також можемо побудувати графік щільності, який також корисний для візуальної перевірки, чи залишки розподілені нормально чи ні. Якщо графік приблизно має форму дзвона, залишки, ймовірно, мають нормальний розподіл.
#Create density plot of residuals
plot(density(res))
Ми бачимо, що графік щільності приблизно повторює форму дзвона, хоча він трохи нахилений вправо. Залежно від типу дослідження дослідник може або не може прийняти рішення про виконання перетворення даних, щоб забезпечити більш нормальний розподіл залишків.
Додаткові ресурси
Як обчислити стандартизовані залишки в R
Як обчислити студентизовані залишки в R
Як створити гістограму залишків у R