Jak przewidzieć wartości w r za pomocą modelu regresji wielokrotnej
Do przewidywania wartości w R przy użyciu dopasowanego modelu regresji liniowej można zastosować następującą podstawową składnię:
#define new observation new <- data. frame (x1=c(5), x2=c(10), x3=c(12.5)) #use fitted model to predict the response value for the new observation predict(model, newdata=new)
Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.
Przykład: Przewidywanie wartości przy użyciu dopasowanego modelu regresji liniowej
Załóżmy, że mamy następujący zbiór danych w R, który zawiera informacje o koszykarzach:
#create data frame df <- data. frame (rating=c(67, 75, 79, 85, 90, 96, 97), points=c(8, 12, 16, 15, 22, 28, 24), assists=c(4, 6, 6, 5, 3, 8, 7), rebounds=c(1, 4, 3, 3, 2, 6, 7)) #view data frame df rating points assists rebounds 1 67 8 4 1 2 75 12 6 4 3 79 16 6 3 4 85 15 5 3 5 90 22 3 2 6 96 28 8 6 7 97 24 7 7
Załóżmy teraz, że dopasowujemy model regresji liniowej wykorzystując punkty , asysty i zbiórki jako zmienne predykcyjne oraz ocenę jakozmienną odpowiedzi :
#fit multiple linear regression model model <- lm(rating ~ points + assists + rebounds, data=df) #view model summary summary(model) Call: lm(formula = rating ~ points + assists + rebounds, data = df) Residuals: 1 2 3 4 5 6 7 -1.5902 -1.7181 0.2413 4.8597 -1.0201 -0.6082 -0.1644 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 66.4355 6.6932 9.926 0.00218 ** points 1.2152 0.2788 4.359 0.02232 * assists -2.5968 1.6263 -1.597 0.20860 rebounds 2.8202 1.6118 1.750 0.17847 --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.193 on 3 degrees of freedom Multiple R-squared: 0.9589, Adjusted R-squared: 0.9179 F-statistic: 23.35 on 3 and 3 DF, p-value: 0.01396
Z wartości w kolumnie Oszacowanie możemy napisać dopasowany model regresji:
Wynik = 66,4355 + 1,2151 (punktów) – 2,5968 (asysty) + 2,8202 (zbiórki)
Możemy użyć poniższego kodu, aby przewidzieć ocenę nowego zawodnika, który zdobędzie 20 punktów, 5 asyst i 2 zbiórki:
#define new player new <- data. frame (points=c(20), assists=c(5), rebounds=c(2)) #use the fitted model to predict the rating for the new player predict(model, newdata=new) 1 83.39607
Model przewiduje, że nowy gracz będzie miał rating na poziomie 83,39607 .
Możemy potwierdzić, że jest to poprawne, wstawiając wartości nowego gracza do dopasowanego równania regresji:
- Wynik = 66,4355 + 1,2151 (punktów) – 2,5968 (asysty) + 2,8202 (zbiórki)
- Ocena = 66,4355 + 1,2151(20) – 2,5968(5) + 2,8202(2)
- Wynik = 83,39
Odpowiada to wartości obliczonej za pomocą funkcji przewidywania() w języku R.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak wykonać prostą regresję liniową w R
Jak wykonać wielokrotną regresję liniową w R
Jak utworzyć wykres rezydualny w R