Як створити діаграми доданих змінних у r


У статистиці графіки доданих змінних — це окремі графіки, які відображають зв’язок між змінною відповіді та змінною предиктором у моделі множинної лінійної регресії, одночасно контролюючи присутність інших змінних предиктора в моделі.

Примітка: іноді ці графіки також називають «діаграми часткової регресії».

Цей тип графіка дозволяє спостерігати зв’язок між кожною окремою змінною предиктора та змінною відповіді в моделі, утримуючи інші змінні предиктора постійними.

Щоб створити графіки доданих змінних у R, ми можемо використати функцію avPlots() із пакету car :

 #load car package
library (car) 

#fit multiple linear regression model
model <- lm(y ~ x1 + x2 + ..., data = df)

#create added variable plots
avPlots(model)

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: додавання графіків змінних у R

Припустімо, що ми використовуємо наступну модель множинної лінійної регресії в R, використовуючи дані з набору даних mtcars :

 #fit multiple linear regression model
model <- lm(mpg ~ disp + hp + drat, data = mtcars)

#view summary of model
summary(model)

Call:
lm(formula = mpg ~ disp + hp + drat, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.1225 -1.8454 -0.4456 1.1342 6.4958 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept) 19.344293 6.370882 3.036 0.00513 **
available -0.019232 0.009371 -2.052 0.04960 * 
hp -0.031229 0.013345 -2.340 0.02663 * 
drat 2.714975 1.487366 1.825 0.07863 . 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.008 on 28 degrees of freedom
Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 
F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09

Щоб візуалізувати зв’язок між змінною відповіді «mpg» і кожною окремою змінною предиктора в моделі, ми можемо створювати графіки доданих змінних за допомогою функції avPlots() :

 #load car package
library (car)

#produce added variable plots
avPlots(model)

Додавання графіка змінної в R

Ось як тлумачити кожен сюжет:

  • На осі х відображається одна змінна предиктора, а на осі у – змінна відповіді.
  • Блакитна лінія показує зв’язок між змінною предиктора та змінною відповіді, у той час як значення всіх інших змінних предиктора залишається постійним .
  • Позначені точки на кожному графіку представляють два спостереження з найбільшими залишками та два спостереження з найбільшим частковим левериджем.

Зверніть увагу, що кут лінії на кожній діаграмі відповідає знаку коефіцієнта оцінюваного рівняння регресії.

Наприклад, ось оцінені коефіцієнти для кожної змінної предиктора в моделі:

  • дисплей: -0,019232
  • ch: -0,031229
  • дата: 2.714975

Зауважте, що кут лінії додатний на графіку доданої змінної для drat , тоді як він є від’ємним для disp і hp , що відповідає знакам їхніх оцінених коефіцієнтів:

Як інтерпретувати графіки доданих змінних

Ці графіки дозволяють нам легко візуалізувати зв’язок між кожною окремою змінною предиктора та змінною відповіді.

Додаткові ресурси

Як виконати просту лінійну регресію в R
Як виконати множинну лінійну регресію в R
Як виконати логістичну регресію в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *