Cara membuat plot variabel tambahan di r
Dalam statistik, plot variabel tambahan adalah plot individual yang menampilkan hubungan antara variabel respon dan variabel prediktor dalam model regresi linier berganda, sekaligus mengontrol keberadaan variabel prediktor lain dalam model.
Catatan: Terkadang plot ini juga disebut “plot regresi parsial”.
Jenis plot ini memungkinkan kita untuk mengamati hubungan antara masing-masing variabel prediktor dan variabel respons dalam suatu model sambil menjaga variabel prediktor lainnya tetap konstan.
Untuk membuat plot variabel yang ditambahkan di R, kita dapat menggunakan fungsi avPlots() dari paket car :
#load car package library (car) #fit multiple linear regression model model <- lm(y ~ x1 + x2 + ..., data = df) #create added variable plots avPlots(model)
Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.
Contoh: Menambahkan Plot Variabel di R
Misalkan kita memasang model regresi linier berganda berikut di R, menggunakan data dari kumpulan data mtcars :
#fit multiple linear regression model model <- lm(mpg ~ disp + hp + drat, data = mtcars) #view summary of model summary(model) Call: lm(formula = mpg ~ disp + hp + drat, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.1225 -1.8454 -0.4456 1.1342 6.4958 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 19.344293 6.370882 3.036 0.00513 ** available -0.019232 0.009371 -2.052 0.04960 * hp -0.031229 0.013345 -2.340 0.02663 * drat 2.714975 1.487366 1.825 0.07863 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.008 on 28 degrees of freedom Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
Untuk memvisualisasikan hubungan antara variabel respons “mpg” dan masing-masing variabel prediktor dalam model, kita dapat membuat plot variabel tambahan menggunakan fungsi avPlots() :
#load car package
library (car)
#produce added variable plots
avPlots(model)
Berikut cara menafsirkan setiap plot:
- Sumbu x menampilkan satu variabel prediktor dan sumbu y menampilkan variabel respon.
- Garis biru menunjukkan hubungan antara variabel prediktor dan variabel respons, sementara nilai semua variabel prediktor lainnya tetap konstan .
- Titik-titik berlabel di setiap grafik mewakili dua observasi dengan residu terbesar dan dua observasi dengan leverage parsial terbesar.
Perhatikan bahwa sudut garis pada setiap plot sesuai dengan tanda koefisien persamaan regresi yang diestimasi.
Misalnya, berikut estimasi koefisien untuk setiap variabel prediktor dalam model:
- tampilan: -0,019232
- bab: -0,031229
- tanggal: 2.714975
Perhatikan bahwa sudut garis bernilai positif pada plot variabel yang ditambahkan untuk drat sedangkan sudut garis bernilai negatif untuk disp dan hp , yang sesuai dengan tanda estimasi koefisiennya:
Grafik ini memungkinkan kita dengan mudah memvisualisasikan hubungan antara masing-masing variabel prediktor dan variabel respons.
Sumber daya tambahan
Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Bagaimana melakukan regresi logistik di R