R'de artık standart hata nasıl hesaplanır
R’ye doğrusal bir regresyon modeli yerleştirdiğimizde model aşağıdaki formu alır:
Y = β 0 + β 1 X + … + β ben
burada ϵ X’ten bağımsız bir hata terimidir.
X, Y’nin değerlerini tahmin etmek için nasıl kullanılırsa kullanılsın, modelde her zaman rastgele hata olacaktır. Bu rastgele hatanın dağılımını ölçmenin bir yolu, artıkların (ϵ) standart sapmasını ölçmenin bir yolu olan artık standart hatayı kullanmaktır.
Bir regresyon modelinin artık standart hatası şu şekilde hesaplanır:
Artık standart hata = √ SS artıkları / df artıkları
Altın:
- Artıklar SS : Kalan kareler toplamı.
- artık df : artık serbestlik dereceleri, n – k – 1 olarak hesaplanır; burada n = toplam gözlem sayısı ve k = toplam model parametre sayısı.
R’deki bir regresyon modelinin artık standart hatasını hesaplamak için kullanabileceğimiz üç yöntem vardır.
Yöntem 1: Model özetini analiz edin
Artık standart hatayı elde etmenin ilk yolu, basitçe bir doğrusal regresyon modeli uydurmak ve ardından model sonuçlarını elde etmek için Summary() komutunu kullanmaktır. Ardından çıktının alt kısmında “kalan standart hata”yı arayın:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Artık standart hatanın 3,127 olduğunu görebiliriz.
Yöntem 2: Basit Bir Formül Kullanın
Artık standart hatayı (RSE) elde etmenin başka bir yolu da doğrusal bir regresyon modeli uydurmak ve ardından RSE’yi hesaplamak için aşağıdaki formülü kullanmaktır:
sqrt( deviance (model)/df. residual (model))
Bu formülün R’de nasıl uygulanacağı aşağıda açıklanmıştır:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
Artık standart hatanın 3,126601 olduğunu görebiliriz.
Yöntem 3: Adım adım formül kullanın
Artık standart hatayı elde etmenin başka bir yolu, doğrusal bir regresyon modeli uygulamak ve ardından RSE formülünün her bir bileşenini hesaplamak için adım adım bir yaklaşım kullanmaktır:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
Artık standart hatanın 3,126601 olduğunu görebiliriz.
Artık standart hata nasıl yorumlanır?
Daha önce de belirtildiği gibi, artık standart hata (RSE), bir regresyon modelinde artıkların standart sapmasını ölçmenin bir yoludur.
CSR değeri ne kadar düşük olursa, model verilere o kadar iyi uyum sağlayabilir (ancak aşırı uyum konusunda dikkatli olun). Bu, hangi modelin verilere en iyi şekilde uyduğunu belirlemek için iki veya daha fazla modeli karşılaştırırken kullanılacak yararlı bir ölçüm olabilir.
Ek kaynaklar
Artık standart hata nasıl yorumlanır?
R’de çoklu doğrusal regresyon nasıl gerçekleştirilir
R’de model performansı için çapraz doğrulama nasıl yapılır
R’de standart sapma nasıl hesaplanır