다중 회귀 모델을 사용하여 r의 값을 예측하는 방법


다음 기본 구문을 사용하여 적합 다중 선형 회귀 모델을 사용하여 R의 값을 예측할 수 있습니다.

 #define new observation
new <- data. frame (x1=c(5), x2=c(10), x3=c(12.5))

#use fitted model to predict the response value for the new observation
predict(model, newdata=new)

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예: 적합 다중 선형 회귀 모델을 사용하여 값 예측

농구 선수에 대한 정보가 포함된 다음과 같은 데이터 세트가 R에 있다고 가정합니다.

 #create data frame
df <- data. frame (rating=c(67, 75, 79, 85, 90, 96, 97),
                 points=c(8, 12, 16, 15, 22, 28, 24),
                 assists=c(4, 6, 6, 5, 3, 8, 7),
                 rebounds=c(1, 4, 3, 3, 2, 6, 7))

#view data frame
df

  rating points assists rebounds
1 67 8 4 1
2 75 12 6 4
3 79 16 6 3
4 85 15 5 3
5 90 22 3 2
6 96 28 8 6
7 97 24 7 7

이제 포인트 , 어시스트 , 리바운드를 예측 변수로 사용하고 등급을 응답 변수 로 사용하여 다중 선형 회귀 모델을 적합하다고 가정합니다.

 #fit multiple linear regression model
model <- lm(rating ~ points + assists + rebounds, data=df)

#view model summary
summary(model)

Call:
lm(formula = rating ~ points + assists + rebounds, data = df)

Residuals:
      1 2 3 4 5 6 7 
-1.5902 -1.7181 0.2413 4.8597 -1.0201 -0.6082 -0.1644 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)   
(Intercept) 66.4355 6.6932 9.926 0.00218 **
points 1.2152 0.2788 4.359 0.02232 * 
assists -2.5968 1.6263 -1.597 0.20860   
rebounds 2.8202 1.6118 1.750 0.17847   
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.193 on 3 degrees of freedom
Multiple R-squared: 0.9589, Adjusted R-squared: 0.9179 
F-statistic: 23.35 on 3 and 3 DF, p-value: 0.01396

Estimate 열의 값을 사용하여 적합 회귀 모델을 작성할 수 있습니다.

점수 = 66.4355 + 1.2151(포인트) – 2.5968(어시스트) + 2.8202(리바운드)

다음 코드를 사용하여 20득점, 5어시스트, 2리바운드를 보유한 새로운 선수의 등급을 예측할 수 있습니다.

 #define new player
new <- data. frame (points=c(20), assists=c(5), rebounds=c(2))

#use the fitted model to predict the rating for the new player
predict(model, newdata=new)

       1 
83.39607 

모델은 이 새로운 플레이어의 평점이 83.39607 이라고 예측합니다.

새로운 플레이어의 값을 적합한 회귀 방정식에 삽입하여 이것이 올바른지 확인할 수 있습니다.

  • 점수 = 66.4355 + 1.2151(포인트) – 2.5968(어시스트) + 2.8202(리바운드)
  • 평점 = 66.4355 + 1.2151(20) – 2.5968(5) + 2.8202(2)
  • 점수 = 83.39

이는 R의 예측() 함수를 사용하여 계산한 값과 일치합니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 잔차 플롯을 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다