So berechnen sie den reststandardfehler in r

Von Dr. Benjamin Anderson Juli 27, 2023 Führung Keine Kommentare

Immer wenn wir ein lineares Regressionsmodell in R anpassen, nimmt das Modell die folgende Form an:

Y = β ₀ + β ₁ X + … + β _i

wobei ϵ ein von X unabhängiger Fehlerterm ist.

Unabhängig davon, wie X verwendet werden kann, um die Werte von Y vorherzusagen, wird es immer zufällige Fehler im Modell geben. Eine Möglichkeit, die Streuung dieses Zufallsfehlers zu messen, ist die Verwendung des Reststandardfehlers , mit dem sich die Standardabweichung der Residuen ϵ messen lässt.

Der verbleibende Standardfehler eines Regressionsmodells wird wie folgt berechnet:

Residueller Standardfehler = √ SS- _Residuen / df- _Residuen

Gold:

_Residuen SS : Die Residualsumme der Quadrate.
_Residual df : Restfreiheitsgrade, berechnet als n – k – 1, wobei n = Gesamtzahl der Beobachtungen und k = Gesamtzahl der Modellparameter.

Es gibt drei Methoden, mit denen wir den verbleibenden Standardfehler eines Regressionsmodells in R berechnen können.

Methode 1: Analysieren Sie die Modellzusammenfassung

Die erste Möglichkeit, den Reststandardfehler zu ermitteln, besteht darin, einfach ein lineares Regressionsmodell anzupassen und dann den Befehl summary() zu verwenden, um die Modellergebnisse zu erhalten. Suchen Sie dann einfach nach „Reststandardfehler“ am Ende der Ausgabe:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Wir können sehen, dass der verbleibende Standardfehler 3,127 beträgt.

Methode 2: Verwenden Sie eine einfache Formel

Eine andere Möglichkeit, den Reststandardfehler (RSE) zu ermitteln, besteht darin, ein lineares Regressionsmodell anzupassen und dann die folgende Formel zur Berechnung des RSE zu verwenden:

 sqrt( deviance (model)/df. residual (model))

So implementieren Sie diese Formel in R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

Wir können sehen, dass der verbleibende Standardfehler 3,126601 beträgt.

Methode 3: Verwenden Sie eine Schritt-für-Schritt-Formel

Eine andere Möglichkeit, den Reststandardfehler zu ermitteln, besteht darin, ein lineares Regressionsmodell anzupassen und dann mithilfe eines schrittweisen Ansatzes jede einzelne Komponente der RSE-Formel zu berechnen:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Wir können sehen, dass der verbleibende Standardfehler 3,126601 beträgt.

So interpretieren Sie den Reststandardfehler

Wie bereits erwähnt, ist der Reststandardfehler (RSE) eine Möglichkeit, die Standardabweichung der Residuen in einem Regressionsmodell zu messen.

Je niedriger der CSR-Wert, desto besser kann ein Modell die Daten anpassen (achten Sie jedoch auf eine Überanpassung ). Dies kann eine nützliche Metrik sein, wenn Sie zwei oder mehr Modelle vergleichen, um zu bestimmen, welches Modell am besten zu den Daten passt.

Zusätzliche Ressourcen

So interpretieren Sie den Reststandardfehler
So führen Sie eine multiple lineare Regression in R durch
So führen Sie eine Kreuzvalidierung der Modellleistung in R durch
So berechnen Sie die Standardabweichung in R

Über den Autor

Dr. Benjamin Anderson

Hallo, ich bin Benjamin, ein pensionierter Statistikprofessor, der sich zum engagierten Statorials-Lehrer entwickelt hat. Mit umfassender Erfahrung und Fachwissen auf dem Gebiet der Statistik bin ich bestrebt, mein Wissen zu teilen, um Studenten durch Statorials zu befähigen. Mehr wissen