Jak utworzyć dołączone wykresy zmiennych w r
W statystyce wykresy zmiennych dodanych to indywidualne wykresy, które przedstawiają związek międzyzmienną odpowiedzi a zmienną predykcyjną w modelu wielokrotnej regresji liniowej, kontrolując jednocześnie obecność innych zmiennych predykcyjnych w modelu.
Uwaga: czasami te wykresy nazywane są także „wykresami regresji częściowej”.
Ten typ wykresu pozwala nam obserwować związek pomiędzy każdą indywidualną zmienną predykcyjną a zmienną odpowiedzi w modelu, przy zachowaniu stałych pozostałych zmiennych predykcyjnych.
Aby utworzyć wykresy dołączonych zmiennych w R, możemy użyć funkcji avPlots() z pakietu car :
#load car package library (car) #fit multiple linear regression model model <- lm(y ~ x1 + x2 + ..., data = df) #create added variable plots avPlots(model)
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: Dodawanie wykresów zmiennych w R
Załóżmy, że dopasowujemy następujący model regresji liniowej w R, korzystając z danych ze zbioru danych mtcars :
#fit multiple linear regression model model <- lm(mpg ~ disp + hp + drat, data = mtcars) #view summary of model summary(model) Call: lm(formula = mpg ~ disp + hp + drat, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.1225 -1.8454 -0.4456 1.1342 6.4958 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 19.344293 6.370882 3.036 0.00513 ** available -0.019232 0.009371 -2.052 0.04960 * hp -0.031229 0.013345 -2.340 0.02663 * drat 2.714975 1.487366 1.825 0.07863 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.008 on 28 degrees of freedom Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
Aby zwizualizować związek pomiędzy zmienną odpowiedzi „mpg” a każdą indywidualną zmienną predykcyjną w modelu, możemy utworzyć wykresy dodanych zmiennych za pomocą funkcji avPlots() :
#load car package
library (car)
#produce added variable plots
avPlots(model)

Oto jak interpretować każdy wykres:
- Oś x wyświetla pojedynczą zmienną predykcyjną, a oś y wyświetla zmienną odpowiedzi.
- Niebieska linia pokazuje powiązanie między zmienną predykcyjną a zmienną odpowiedzi, przy jednoczesnym zachowaniu wartości wszystkich pozostałych zmiennych predykcyjnych na stałym poziomie .
- Oznaczone punkty na każdym wykresie reprezentują dwie obserwacje z największymi resztami i dwie obserwacje z największą dźwignią częściową.
Należy zauważyć, że kąt linii na każdym wykresie odpowiada znakowi współczynnika oszacowanego równania regresji.
Oto na przykład oszacowane współczynniki dla każdej zmiennej predykcyjnej w modelu:
- wyświetlacz: -0.019232
- rozdz.: -0,031229
- data: 2.714975
Należy zauważyć, że kąt linii jest dodatni na dodanym wykresie zmiennych dla drat , natomiast jest ujemny dla disp i hp , co odpowiada znakom ich oszacowanych współczynników:

Wykresy te pozwalają nam łatwo zwizualizować związek pomiędzy każdą indywidualną zmienną predykcyjną a zmienną odpowiedzi.
Dodatkowe zasoby
Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak przeprowadzić regresję logistyczną w R