Cara mengekstrak sisa dari fungsi lm() di r


Anda dapat menggunakan sintaks berikut untuk mengekstrak sisa dari fungsi lm() di R:

 fit$residuals

Contoh ini mengasumsikan bahwa kita menggunakan fungsi lm() agar sesuai dengan model regresi linier dan menamai hasilnya fit .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Terkait: Cara mengekstrak R-Squared dari fungsi lm() di R

Contoh: Cara mengekstrak residu dari lm() di R

Misalkan kita mempunyai kerangka data berikut di R yang berisi informasi tentang menit bermain, total pelanggaran, dan total poin yang dicetak oleh 10 pemain bola basket:

 #create data frame
df <- data. frame (minutes=c(5, 10, 13, 14, 20, 22, 26, 34, 38, 40),
                 fouls=c(5, 5, 3, 4, 2, 1, 3, 2, 1, 1),
                 points=c(6, 8, 8, 7, 14, 10, 22, 24, 28, 30))

#view data frame
df

   minutes fouls points
1 5 5 6
2 10 5 8
3 13 3 8
4 14 4 7
5 20 2 14
6 22 1 10
7 26 3 22
8 34 2 24
9 38 1 28
10 40 1 30

Misalkan kita ingin menyesuaikan model regresi linier berganda berikut:

poin = β 0 + β 1 (menit) + β 2 (pelanggaran)

Kita dapat menggunakan fungsi lm() agar sesuai dengan model regresi ini:

 #fit multiple linear regression model
fit <- lm(points ~ minutes + fouls, data=df)

Kita kemudian dapat mengetikkan fit$residuals untuk mengekstrak residu dari model:

 #extract residuals from model
fit$residuals

         1 2 3 4 5 6 7 
 2.0888729 -0.7982137 0.6371041 -3.5240982 1.9789676 -1.7920822 1.9306786 
         8 9 10 
-1.7048752 0.5692404 0.6144057

Karena total ada 10 observasi di database kami, ada 10 residu – satu untuk setiap observasi.

Misalnya:

  • Pengamatan pertama mempunyai sisa sebesar 2,089 .
  • Observasi kedua mempunyai sisa sebesar -0.798 .
  • Observasi ketiga mempunyai sisa sebesar 0,637 .

Dan seterusnya.

Kita kemudian dapat membuat plot residu terhadap nilai yang dipasang jika kita ingin:

 #store residuals in variable
res <- fit$residuals

#produce residual vs. fitted plot
plot(fitted(fit), res)

#add a horizontal line at 0 
abline(0,0)

Sumbu x menampilkan nilai yang dipasang dan sumbu y menampilkan residu.

Idealnya, residu tersebar secara acak di sekitar nol, tanpa pola yang jelas, untuk memastikan asumsi homoskedastisitas terpenuhi.

Pada plot residu di atas terlihat bahwa residu tampak tersebar secara acak di sekitar nol tanpa pola yang jelas, artinya asumsi homoskedastisitas kemungkinan terpenuhi.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Cara membuat plot sisa di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *