R'de logaritmik regresyon (adım adım)
Logaritmik regresyon, büyümenin veya düşüşün ilk başta hızlı bir şekilde hızlandığı ve daha sonra zamanla yavaşladığı durumları modellemek için kullanılan bir regresyon türüdür.
Örneğin, aşağıdaki grafik logaritmik bozunmanın bir örneğini göstermektedir:
Bu tür bir durum için, yordayıcı değişken ile yanıt değişkeni arasındaki ilişki, logaritmik regresyon kullanılarak iyi bir şekilde modellenebilir.
Logaritmik regresyon modelinin denklemi aşağıdaki formu alır:
y = a + b*ln(x)
Altın:
- y: yanıt değişkeni
- x: tahmin değişkeni
- a, b: x ve y arasındaki ilişkiyi tanımlayan regresyon katsayıları
Aşağıdaki adım adım örnek, R’de logaritmik regresyonun nasıl gerçekleştirileceğini gösterir.
1. Adım: Verileri oluşturun
Öncelikle iki değişken için sahte veriler oluşturalım: x ve y :
x=1:15 y=c(59, 50, 44, 38, 33, 28, 23, 20, 17, 15, 13, 12, 11, 10, 9.5)
2. Adım: Verileri görselleştirin
Şimdi x ile y arasındaki ilişkiyi görselleştirmek için hızlı bir dağılım grafiği oluşturalım:
plot(x, y)
Grafikten iki değişken arasında net bir logaritmik bozunma modelinin olduğunu görebiliriz. Yanıt değişkeninin değeri, y , ilk başta hızlı bir şekilde azalır, daha sonra zamanla yavaşlar.
Bu nedenle değişkenler arasındaki ilişkiyi tanımlamak için logaritmik bir regresyon denklemi kullanmak akıllıca görünmektedir.
Adım 3: Logaritmik regresyon modelini yerleştirin
Daha sonra, tahmin değişkeni olarak x’in ve yanıt değişkeni olarak y’nin doğal logaritmasını kullanarak logaritmik regresyon modeline uyum sağlamak için lm() işlevini kullanacağız.
#fit the model model <- lm(y ~ log (x)) #view the output of the model summary(model) Call: lm(formula = y ~ log(x)) Residuals: Min 1Q Median 3Q Max -4.069 -1.313 -0.260 1.127 3.122 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 63.0686 1.4090 44.76 1.25e-15 *** log(x) -20.1987 0.7019 -28.78 3.70e-13 *** --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 2.054 on 13 degrees of freedom Multiple R-squared: 0.9845, Adjusted R-squared: 0.9834 F-statistic: 828.2 on 1 and 13 DF, p-value: 3.702e-13
Modelin genel F değeri 828,2’dir ve buna karşılık gelen p değeri son derece düşüktür (3,702e-13), bu da modelin bir bütün olarak faydalı olduğunu göstermektedir.
Çıktı tablosundaki katsayıları kullanarak uygun logaritmik regresyon denkleminin şöyle olduğunu görebiliriz:
y = 63.0686 – 20.1987 * ln(x)
Bu denklemi, tahmin değişkeni x’in değerine dayanarak yanıt değişkeni y’yi tahmin etmek için kullanabiliriz. Örneğin, x = 12 ise y’nin 12,87 olacağını tahmin ederiz:
y = 63,0686 – 20,1987 * ln(12) = 12,87
Bonus: Belirli bir tahminci ve yanıt değişkeni için logaritmik regresyon denklemini otomatik olarak hesaplamak için bu çevrimiçi logaritmik regresyon hesaplayıcısını kullanmaktan çekinmeyin.
Adım 4: Logaritmik regresyon modelini görselleştirin
Son olarak logaritmik regresyon modelinin verilere ne kadar iyi uyduğunu görselleştirmek için hızlı bir grafik oluşturabiliriz:
#plot x vs. y plot(x, y) #define x-values to use for regression line x=seq(from= 1 , to= 15 , length. out = 1000 ) #use the model to predict the y-values based on the x-values y=predict(model,newdata=list(x=seq(from= 1 ,to= 15 ,length. out = 1000 )), interval=" confidence ") #add the fitted regression line to the plot (lwd specifies the width of the line) matlines(x,y, lwd= 2 )
Logaritmik regresyon modelinin bu özel veri setine uyma konusunda iyi bir iş çıkardığını görebiliriz.
Ek kaynaklar
R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de ikinci dereceden regresyon nasıl gerçekleştirilir?
R’de üstel regresyon nasıl gerçekleştirilir
R’de polinom regresyonu nasıl gerçekleştirilir