Как создать остаточный график в r


Графики остатков часто используются для оценки того, нормально ли распределяются остатки регрессионного анализа и проявляют ли они гетероскедастичность .

В этом руководстве объясняется, как создать графики остатков для регрессионной модели в R.

Пример: остаточные графики в R

В этом примере мы подберем регрессионную модель, используя встроенный набор данных R mtcars , а затем создадим три различных графика остатков для анализа остатков.

Шаг 1: Подберите регрессионную модель.

Во-первых, мы подберем регрессионную модель, используя миль на галлон в качестве переменной отклика и disp и hp в качестве объясняющих переменных:

 #load the dataset
data(mtcars)

#fit a regression model
model <- lm(mpg~disp+hp, data=mtcars)

#get list of residuals 
res <- resid(model)

Шаг 2: Создайте остаточный или скорректированный график.

Далее мы создадим график остатков/подгонки, полезный для визуального обнаружения гетероскедастичности – например, систематического изменения в распределении остатков по диапазону значений.

 #produce residual vs. fitted plot
plot(fitted(model), res)

#add a horizontal line at 0 
abline(0,0)

Остаточный или скорректированный рельеф в R

По оси X отображаются подобранные значения, а по оси Y — остатки. Из графика мы видим, что распределение остатков имеет тенденцию быть выше для более высоких подобранных значений, но это не кажется достаточно серьезным, чтобы нам нужно было вносить изменения в модель.

Шаг 3: Создайте график QQ.

Мы также можем построить график QQ, полезный для определения того, соответствуют ли остатки нормальному распределению. Если значения данных на графике следуют примерно прямой линии под углом 45 градусов, то данные распределены нормально.

 #create QQ plot for residuals
qqnorm(res)

#add a straight diagonal line to the plot
qqline(res) 

График остаточного QQ в R

Мы видим, что остатки имеют тенденцию немного отклоняться от линии возле хвостов, что может указывать на то, что они не распределены нормально.

Шаг 4: Создайте график плотности.

Мы также можем построить график плотности, который также полезен для визуальной проверки того, нормально ли распределены остатки или нет. Если график имеет примерно колоколообразную форму, остатки, вероятно, имеют нормальное распределение.

 #Create density plot of residuals
plot(density(res))

Кривая остаточной плотности в R

Мы видим, что график плотности примерно имеет колоколообразную форму, хотя и слегка наклонен вправо. В зависимости от типа исследования исследователь может решить или не решить выполнить преобразование данных, чтобы гарантировать более нормальное распределение остатков.

Дополнительные ресурсы

Как рассчитать стандартизированные остатки в R
Как рассчитать стьюдентизированные остатки в R
Как создать гистограмму остатков в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *