Artık standart hata nasıl yorumlanır?
Artık standart hata, bir regresyon modelinin bir veri setine ne kadar iyi uyduğunu ölçmek için kullanılır.
Basit bir ifadeyle, bir regresyon modelinde artıkların standart sapmasını ölçer.
Aşağıdaki şekilde hesaplanır:
Artık standart hata = √ Σ(y – ŷ) 2 /df
Altın:
- y: Gözlemlenen değer
- ŷ: Tahmin edilen değer
- df: Toplam gözlem sayısı – toplam model parametre sayısı olarak hesaplanan serbestlik derecesi.
Artık standart hata ne kadar küçük olursa, regresyon modeli bir veri setine o kadar iyi uyar. Tersine, artık standart hata ne kadar yüksek olursa, regresyon modelinin bir veri kümesine uyması o kadar kötü olur.
Küçük bir artık standart hatası olan bir regresyon modelinde, uygun regresyon çizgisi etrafında sıkı bir şekilde kümelenmiş veri noktaları bulunacaktır:
Bu modelin artıkları (gözlenen değerler ile tahmin edilen değerler arasındaki fark) küçük olacaktır, yani artık standart hata da küçük olacaktır.
Tersine, büyük bir artık standart hatası olan bir regresyon modelinde, veri noktaları uygun regresyon çizgisi etrafında daha gevşek bir şekilde dağılmış olacaktır:
Bu modelin artıkları daha büyük olacaktır, bu da artık standart hatasının da daha büyük olacağı anlamına gelir.
Aşağıdaki örnek, R’deki bir regresyon modelinin artık standart hatasının nasıl hesaplanacağını ve yorumlanacağını gösterir.
Örnek: Artık standart hatanın yorumlanması
Aşağıdaki çoklu doğrusal regresyon modeline uymak istediğimizi varsayalım:
mpg = β 0 + β 1 (yer değiştirme) + β 2 (güç)
Bu model, belirli bir arabanın galon başına kat ettiği mesafeyi tahmin etmek için “yer değiştirme” ve “beygir gücü” tahmin değişkenlerini kullanır.
Aşağıdaki kod, bu regresyon modelinin R’ye nasıl sığdırılacağını gösterir:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Sonucun alt kısmına doğru bu modelin artık standart hatasının 3,127 olduğunu görebiliriz.
Bu bize, regresyon modelinin araba mpg’sini ortalama 3.127 hatayla tahmin ettiğini söylüyor.
Modelleri karşılaştırmak için artık standart hatayı kullanma
Artık standart hata, farklı regresyon modellerinin uyumunun karşılaştırılmasında özellikle yararlıdır.
Örneğin, araba mpg’sini tahmin etmek için iki farklı regresyon modeli uyguladığımızı varsayalım. Her modelin artık standart hatası aşağıdaki gibidir:
- Model 1’in kalan standart hatası: 3,127
- Model 2’nin kalan standart hatası: 5,657
Model 1’in artık standart hatası daha düşük olduğundan verilere Model 2’den daha iyi uyum sağlar. Bu nedenle, araba mpg’sini tahmin etmek için Model 1’i kullanmayı tercih ederiz, çünkü yaptığı tahminler arabaların gözlemlenen mpg değerlerine daha yakındır.
Ek kaynaklar
R’de basit doğrusal regresyon nasıl gerçekleştirilir
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de artık arsa nasıl oluşturulur