R에서 거듭제곱 회귀를 수행하는 방법(단계별)


거듭제곱 회귀는 다음 형식을 취하는 비선형 회귀 유형입니다.

y = 도끼 b

금:

  • y: 응답 변수
  • x: 예측 변수
  • a, b: xy 사이의 관계를 설명하는 회귀 계수

이러한 유형의 회귀는 반응 변수가 거듭제곱된 예측 변수와 동일한 상황을 모델링하는 데 사용됩니다.

다음 단계별 예는 R에서 주어진 데이터세트에 대해 거듭제곱 회귀를 수행하는 방법을 보여줍니다.

1단계: 데이터 생성

먼저 x와 y라는 두 변수에 대한 가짜 데이터를 만들어 보겠습니다.

 #create data
x=1:20
y=c(1, 8, 5, 7, 6, 20, 15, 19, 23, 37, 33, 38, 49, 50, 56, 52, 70, 89, 97, 115)

2단계: 데이터 시각화

다음으로 x와 y 사이의 관계를 시각화하는 산점도를 만들어 보겠습니다.

 #create scatterplot
plot(x, y) 

그래프는 두 변수 사이에 명확한 검정력 관계가 있음을 보여줍니다. 따라서 선형 회귀 모델보다는 거듭제곱 회귀 방정식을 데이터에 맞추는 것이 현명해 보입니다.

3단계: 검정력 회귀 모델 적합

다음으로, lm() 함수를 사용하여 회귀 모델을 데이터에 맞추고 모델을 맞출 때 R이 응답 변수 로그와 예측 변수 로그를 사용해야 함을 지정합니다.

 #fit the model
model <- lm(log(y)~ log(x))

#view the output of the model
summary(model)

Call:
lm(formula = log(y) ~ log(x))

Residuals:
     Min 1Q Median 3Q Max 
-0.67014 -0.17190 -0.05341 0.16343 0.93186 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 0.15333 0.20332 0.754 0.461    
log(x) 1.43439 0.08996 15.945 4.62e-12 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.3187 on 18 degrees of freedom
Multiple R-squared: 0.9339, Adjusted R-squared: 0.9302 
F-statistic: 254.2 on 1 and 18 DF, p-value: 4.619e-12

모델의 전체 F-값 은 252.1이고 해당 p-값은 매우 낮습니다(4.619e-12). 이는 모델 전체가 유용함을 나타냅니다.

출력 테이블의 계수를 사용하여 적합 검정력 회귀 방정식이 다음과 같다는 것을 알 수 있습니다.

ln(y) = 0.15333 + 1.43439ln(x)

e를 양쪽에 적용하면 방정식을 다음과 같이 다시 작성할 수 있습니다.

  • y = e 0.15333 + 1.43439ln(x)
  • y = 1.1657x 1.43439

이 방정식을 사용하여 예측 변수 x 값을 기반으로 응답 변수 y 를 예측할 수 있습니다.

예를 들어, x = 12이면 y는 41.167 이 될 것이라고 예측합니다.

y = 1.1657(12) 1.43439 = 41.167

보너스: 이 온라인 전력 회귀 계산기를 사용하여 주어진 예측 변수 및 응답 변수에 대한 전력 회귀 방정식을 자동으로 계산할 수 있습니다.

추가 리소스

R에서 다중 선형 회귀를 수행하는 방법
R에서 지수 회귀를 수행하는 방법
R에서 로그 회귀를 수행하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다