Cara menghitung sisa kesalahan standar di r


Setiap kali kita memasukkan model regresi linier ke dalam R, model tersebut mengambil bentuk berikut:

Y = β 0 + β 1 X + … + β saya

dimana ϵ adalah suku kesalahan yang tidak bergantung pada X.

Tidak peduli bagaimana X dapat digunakan untuk memprediksi nilai Y, akan selalu ada kesalahan acak dalam model. Salah satu cara untuk mengukur sebaran kesalahan acak ini adalah dengan menggunakan kesalahan standar sisa , yaitu cara mengukur simpangan baku dari sisa ϵ.

Kesalahan standar sisa model regresi dihitung sebagai berikut:

Kesalahan standar sisa = √ Residu SS / residu df

Emas:

  • Residual SS : Jumlah sisa kuadrat.
  • sisa df : sisa derajat kebebasan, dihitung sebagai n – k – 1 dimana n = jumlah observasi dan k = jumlah parameter model.

Ada tiga metode yang dapat kita gunakan untuk menghitung sisa standar error model regresi di R.

Metode 1: Analisis ringkasan model

Cara pertama untuk mendapatkan sisa standar error adalah dengan menyesuaikan model regresi linier dan kemudian menggunakan perintah ringkasan() untuk mendapatkan hasil model. Kemudian cari saja “kesalahan standar sisa” di bagian bawah keluaran:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Kita dapat melihat bahwa kesalahan standar sisa adalah 3.127 .

Metode 2: Gunakan Rumus Sederhana

Cara lain untuk mendapatkan sisa standar error (RSE) adalah dengan menyesuaikan model regresi linier dan kemudian menggunakan rumus berikut untuk menghitung RSE:

 sqrt( deviance (model)/df. residual (model))

Berikut cara menerapkan rumus ini di R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

Kita dapat melihat bahwa kesalahan standar sisa adalah 3.126601 .

Metode 3: Gunakan rumus langkah demi langkah

Cara lain untuk mendapatkan kesalahan standar sisa adalah dengan menyesuaikan model regresi linier dan kemudian menggunakan pendekatan langkah demi langkah untuk menghitung setiap komponen rumus RSE:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Kita dapat melihat bahwa kesalahan standar sisa adalah 3.126601 .

Bagaimana menafsirkan kesalahan standar sisa

Seperti disebutkan sebelumnya, sisa standar error (RSE) adalah cara untuk mengukur simpangan baku dari sisa dalam model regresi.

Semakin rendah nilai CSR, semakin baik model tersebut mampu menyesuaikan dengan data (namun hati-hati jangan sampai overfitting ). Ini bisa menjadi metrik yang berguna untuk digunakan saat membandingkan dua model atau lebih guna menentukan model mana yang paling sesuai dengan data.

Sumber daya tambahan

Bagaimana menafsirkan kesalahan standar sisa
Cara melakukan regresi linier berganda di R
Cara melakukan validasi silang untuk kinerja model di R
Cara menghitung simpangan baku di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *