R에서 거듭제곱 회귀를 수행하는 방법(단계별)
거듭제곱 회귀는 다음 형식을 취하는 비선형 회귀 유형입니다.
y = 도끼 b
금:
- y: 응답 변수
- x: 예측 변수
- a, b: x 와 y 사이의 관계를 설명하는 회귀 계수
이러한 유형의 회귀는 반응 변수가 거듭제곱된 예측 변수와 동일한 상황을 모델링하는 데 사용됩니다.
다음 단계별 예는 R에서 주어진 데이터세트에 대해 거듭제곱 회귀를 수행하는 방법을 보여줍니다.
1단계: 데이터 생성
먼저 x와 y라는 두 변수에 대한 가짜 데이터를 만들어 보겠습니다.
#create data
x=1:20
y=c(1, 8, 5, 7, 6, 20, 15, 19, 23, 37, 33, 38, 49, 50, 56, 52, 70, 89, 97, 115)
2단계: 데이터 시각화
다음으로 x와 y 사이의 관계를 시각화하는 산점도를 만들어 보겠습니다.
#create scatterplot
plot(x, y)
그래프는 두 변수 사이에 명확한 검정력 관계가 있음을 보여줍니다. 따라서 선형 회귀 모델보다는 거듭제곱 회귀 방정식을 데이터에 맞추는 것이 현명해 보입니다.
3단계: 검정력 회귀 모델 적합
다음으로, lm() 함수를 사용하여 회귀 모델을 데이터에 맞추고 모델을 맞출 때 R이 응답 변수 로그와 예측 변수 로그를 사용해야 함을 지정합니다.
#fit the model model <- lm(log(y)~ log(x)) #view the output of the model summary(model) Call: lm(formula = log(y) ~ log(x)) Residuals: Min 1Q Median 3Q Max -0.67014 -0.17190 -0.05341 0.16343 0.93186 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.15333 0.20332 0.754 0.461 log(x) 1.43439 0.08996 15.945 4.62e-12 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.3187 on 18 degrees of freedom Multiple R-squared: 0.9339, Adjusted R-squared: 0.9302 F-statistic: 254.2 on 1 and 18 DF, p-value: 4.619e-12
모델의 전체 F-값 은 252.1이고 해당 p-값은 매우 낮습니다(4.619e-12). 이는 모델 전체가 유용함을 나타냅니다.
출력 테이블의 계수를 사용하여 적합 검정력 회귀 방정식이 다음과 같다는 것을 알 수 있습니다.
ln(y) = 0.15333 + 1.43439ln(x)
e를 양쪽에 적용하면 방정식을 다음과 같이 다시 작성할 수 있습니다.
- y = e 0.15333 + 1.43439ln(x)
- y = 1.1657x 1.43439
이 방정식을 사용하여 예측 변수 x 값을 기반으로 응답 변수 y 를 예측할 수 있습니다.
예를 들어, x = 12이면 y는 41.167 이 될 것이라고 예측합니다.
y = 1.1657(12) 1.43439 = 41.167
보너스: 이 온라인 전력 회귀 계산기를 사용하여 주어진 예측 변수 및 응답 변수에 대한 전력 회귀 방정식을 자동으로 계산할 수 있습니다.