Cara menghitung sisa kesalahan standar di r
Setiap kali kita memasukkan model regresi linier ke dalam R, model tersebut mengambil bentuk berikut:
Y = β 0 + β 1 X + … + β saya
dimana ϵ adalah suku kesalahan yang tidak bergantung pada X.
Tidak peduli bagaimana X dapat digunakan untuk memprediksi nilai Y, akan selalu ada kesalahan acak dalam model. Salah satu cara untuk mengukur sebaran kesalahan acak ini adalah dengan menggunakan kesalahan standar sisa , yaitu cara mengukur simpangan baku dari sisa ϵ.
Kesalahan standar sisa model regresi dihitung sebagai berikut:
Kesalahan standar sisa = √ Residu SS / residu df
Emas:
- Residual SS : Jumlah sisa kuadrat.
- sisa df : sisa derajat kebebasan, dihitung sebagai n – k – 1 dimana n = jumlah observasi dan k = jumlah parameter model.
Ada tiga metode yang dapat kita gunakan untuk menghitung sisa standar error model regresi di R.
Metode 1: Analisis ringkasan model
Cara pertama untuk mendapatkan sisa standar error adalah dengan menyesuaikan model regresi linier dan kemudian menggunakan perintah ringkasan() untuk mendapatkan hasil model. Kemudian cari saja “kesalahan standar sisa” di bagian bawah keluaran:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Kita dapat melihat bahwa kesalahan standar sisa adalah 3.127 .
Metode 2: Gunakan Rumus Sederhana
Cara lain untuk mendapatkan sisa standar error (RSE) adalah dengan menyesuaikan model regresi linier dan kemudian menggunakan rumus berikut untuk menghitung RSE:
sqrt( deviance (model)/df. residual (model))
Berikut cara menerapkan rumus ini di R:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
Kita dapat melihat bahwa kesalahan standar sisa adalah 3.126601 .
Metode 3: Gunakan rumus langkah demi langkah
Cara lain untuk mendapatkan kesalahan standar sisa adalah dengan menyesuaikan model regresi linier dan kemudian menggunakan pendekatan langkah demi langkah untuk menghitung setiap komponen rumus RSE:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
Kita dapat melihat bahwa kesalahan standar sisa adalah 3.126601 .
Bagaimana menafsirkan kesalahan standar sisa
Seperti disebutkan sebelumnya, sisa standar error (RSE) adalah cara untuk mengukur simpangan baku dari sisa dalam model regresi.
Semakin rendah nilai CSR, semakin baik model tersebut mampu menyesuaikan dengan data (namun hati-hati jangan sampai overfitting ). Ini bisa menjadi metrik yang berguna untuk digunakan saat membandingkan dua model atau lebih guna menentukan model mana yang paling sesuai dengan data.
Sumber daya tambahan
Bagaimana menafsirkan kesalahan standar sisa
Cara melakukan regresi linier berganda di R
Cara melakukan validasi silang untuk kinerja model di R
Cara menghitung simpangan baku di R