R의 지수 회귀(단계별)
지수 회귀는 다음 상황을 모델링하는 데 사용할 수 있는 회귀 유형입니다.
1. 기하급수적 성장: 성장은 천천히 시작되었다가 제한 없이 빠르게 가속화됩니다.
2. 지수적 붕괴: 붕괴는 빠르게 시작되었다가 속도가 느려지고 점점 0에 가까워집니다.
지수 회귀 모델의 방정식은 다음 형식을 취합니다.
y = ab x
금:
- y: 응답 변수
- x: 예측 변수
- a, b: x 와 y 사이의 관계를 설명하는 회귀 계수
다음 단계별 예제에서는 R에서 지수 회귀를 수행하는 방법을 보여줍니다.
1단계: 데이터 생성
먼저 x 와 y 라는 두 변수에 대한 가짜 데이터를 만들어 보겠습니다.
x=1:20 y=c(1, 3, 5, 7, 9, 12, 15, 19, 23, 28, 33, 38, 44, 50, 56, 64, 73, 84, 97, 113)
2단계: 데이터 시각화
다음으로, x 와 y 사이의 관계를 시각화하기 위한 빠른 산점도를 만들어 보겠습니다.
plot(x, y)
그래프를 보면 두 변수 사이에 명확한 지수적 성장 패턴이 있음을 알 수 있습니다.
따라서 변수 간의 관계를 설명하기 위해 지수 회귀 방정식을 적용하는 것이 현명한 것 같습니다.
3단계: 지수 회귀 모델 적합
다음으로 lm() 함수를 사용하여 y 의 자연 로그를 응답 변수 로 사용하고 x를 예측 변수로 사용하여 지수 회귀 모델에 적합합니다.
#fit the model model <- lm( log (y) ~ x) #view the output of the model summary(model) Call: lm(formula = log(y) ~ x) Residuals: Min 1Q Median 3Q Max -1.1858 -0.1768 0.1104 0.2720 0.3300 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 0.98166 0.17118 5.735 1.95e-05 *** x 0.20410 0.01429 14.283 2.92e-11 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 0.3685 on 18 degrees of freedom Multiple R-squared: 0.9189, Adjusted R-squared: 0.9144 F-statistic: 204 on 1 and 18 DF, p-value: 2.917e-11
모델의 전체 F-값 은 204이고 해당 p-값은 매우 낮습니다(2.917e-11). 이는 모델 전체가 유용함을 나타냅니다.
출력 테이블의 계수를 사용하여 적합 지수 회귀 방정식이 다음과 같다는 것을 알 수 있습니다.
ln(y) = 0.9817 + 0.2041(x)
e를 양쪽에 적용하면 방정식을 다음과 같이 다시 작성할 수 있습니다.
y = 2.6689 * 1.2264x
이 방정식을 사용하여 예측 변수 x 값을 기반으로 응답 변수 y 를 예측할 수 있습니다. 예를 들어 x = 12이면 y는 30.897이 될 것으로 예측합니다.
y = 2.6689 * 1.2264 12 = 30.897
보너스: 이 온라인 지수 회귀 계산기를 사용하여 주어진 예측 변수와 응답 변수에 대한 지수 회귀 방정식을 자동으로 계산할 수 있습니다.
추가 리소스
R에서 단순 선형 회귀를 수행하는 방법
R에서 다중 선형 회귀를 수행하는 방법
R에서 2차 회귀를 수행하는 방법
R에서 다항식 회귀를 수행하는 방법