Cara memprediksi nilai dalam r menggunakan model regresi berganda


Anda dapat menggunakan sintaks dasar berikut untuk memprediksi nilai dalam R menggunakan model regresi linier berganda yang dilengkapi:

 #define new observation
new <- data. frame (x1=c(5), x2=c(10), x3=c(12.5))

#use fitted model to predict the response value for the new observation
predict(model, newdata=new)

Contoh berikut menunjukkan cara menggunakan fungsi ini dalam praktiknya.

Contoh: Memprediksi nilai menggunakan model regresi linier berganda yang sesuai

Misalkan kita memiliki kumpulan data berikut di R yang berisi informasi tentang pemain bola basket:

 #create data frame
df <- data. frame (rating=c(67, 75, 79, 85, 90, 96, 97),
                 points=c(8, 12, 16, 15, 22, 28, 24),
                 assists=c(4, 6, 6, 5, 3, 8, 7),
                 rebounds=c(1, 4, 3, 3, 2, 6, 7))

#view data frame
df

  rating points assists rebounds
1 67 8 4 1
2 75 12 6 4
3 79 16 6 3
4 85 15 5 3
5 90 22 3 2
6 96 28 8 6
7 97 24 7 7

Sekarang misalkan kita menyesuaikan model regresi linier berganda dengan menggunakan points , assists , dan rebounds sebagai variabel prediktor dan rating sebagai variabel respon :

 #fit multiple linear regression model
model <- lm(rating ~ points + assists + rebounds, data=df)

#view model summary
summary(model)

Call:
lm(formula = rating ~ points + assists + rebounds, data = df)

Residuals:
      1 2 3 4 5 6 7 
-1.5902 -1.7181 0.2413 4.8597 -1.0201 -0.6082 -0.1644 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) 66.4355 6.6932 9.926 0.00218 **
points 1.2152 0.2788 4.359 0.02232 * 
assists -2.5968 1.6263 -1.597 0.20860   
rebounds 2.8202 1.6118 1.750 0.17847   
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.193 on 3 degrees of freedom
Multiple R-squared: 0.9589, Adjusted R-squared: 0.9179 
F-statistic: 23.35 on 3 and 3 DF, p-value: 0.01396

Dari nilai pada kolom Estimasi , kita dapat menuliskan model regresi yang sesuai:

Skor = 66.4355 + 1.2151 (poin) – 2.5968 (assist) + 2.8202 (rebound)

Kita dapat menggunakan kode berikut untuk memprediksi rating pemain baru yang memiliki 20 poin, 5 assist, dan 2 rebound:

 #define new player
new <- data. frame (points=c(20), assists=c(5), rebounds=c(2))

#use the fitted model to predict the rating for the new player
predict(model, newdata=new)

       1 
83.39607 

Model tersebut memperkirakan pemain baru ini akan memiliki rating 83.39607 .

Kami dapat mengonfirmasi kebenarannya dengan memasukkan nilai pemain baru ke dalam persamaan regresi yang sesuai:

  • Skor = 66.4355 + 1.2151 (poin) – 2.5968 (assist) + 2.8202 (rebound)
  • Peringkat = 66,4355 + 1,2151(20) – 2,5968(5) + 2,8202(2)
  • Skor = 83,39

Ini cocok dengan nilai yang kami hitung menggunakan fungsi prediksi() di R.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara melakukan regresi linier sederhana di R
Cara melakukan regresi linier berganda di R
Cara membuat plot sisa di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *