Как создать графики добавленных переменных в r


В статистике графики добавленных переменных представляют собой отдельные графики, которые отображают взаимосвязь между переменной ответа и переменной-предиктором в модели множественной линейной регрессии, одновременно контролируя наличие других переменных-предикторов в модели.

Примечание. Иногда эти графики также называют «графиками частичной регрессии».

Этот тип графика позволяет нам наблюдать взаимосвязь между каждой отдельной переменной-предиктором и переменной отклика в модели, сохраняя при этом другие переменные-предикторы постоянными.

Чтобы создать графики добавленных переменных в R, мы можем использовать функцию avPlots() из пакета car :

 #load car package
library (car) 

#fit multiple linear regression model
model <- lm(y ~ x1 + x2 + ..., data = df)

#create added variable plots
avPlots(model)

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: добавление графиков переменных в R

Предположим, мы подгоняем следующую модель множественной линейной регрессии в R, используя данные из набора данных mtcars :

 #fit multiple linear regression model
model <- lm(mpg ~ disp + hp + drat, data = mtcars)

#view summary of model
summary(model)

Call:
lm(formula = mpg ~ disp + hp + drat, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-5.1225 -1.8454 -0.4456 1.1342 6.4958 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)   
(Intercept) 19.344293 6.370882 3.036 0.00513 **
available -0.019232 0.009371 -2.052 0.04960 * 
hp -0.031229 0.013345 -2.340 0.02663 * 
drat 2.714975 1.487366 1.825 0.07863 . 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.008 on 28 degrees of freedom
Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 
F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09

Чтобы визуализировать связь между переменной ответа «миль на галлон» и каждой отдельной переменной-предиктором в модели, мы можем построить графики добавленных переменных, используя функцию avPlots() :

 #load car package
library (car)

#produce added variable plots
avPlots(model)

Добавление графика переменных в R

Вот как интерпретировать каждый сюжет:

  • По оси X отображается одна предикторная переменная, а по оси Y отображается переменная отклика.
  • Синяя линия показывает связь между переменной-предиктором и переменной ответа, при этом значения всех остальных переменных-предикторов остаются постоянными .
  • Отмеченные точки на каждом графике представляют два наблюдения с наибольшими остатками и два наблюдения с наибольшим частичным рычагом.

Обратите внимание, что угол линии на каждом графике соответствует знаку коэффициента предполагаемого уравнения регрессии.

Например, вот предполагаемые коэффициенты для каждой предикторной переменной в модели:

  • дисплей: -0,019232
  • ч: -0,031229
  • дата: 2.714975

Обратите внимание, что угол линии положителен на графике добавленной переменной для drat и отрицателен для disp и hp , что соответствует знакам их расчетных коэффициентов:

Как интерпретировать графики добавленных переменных

Эти графики позволяют нам легко визуализировать взаимосвязь между каждой отдельной переменной-предиктором и переменной ответа.

Дополнительные ресурсы

Как выполнить простую линейную регрессию в R
Как выполнить множественную линейную регрессию в R
Как выполнить логистическую регрессию в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *