So berechnen sie den reststandardfehler in r
Immer wenn wir ein lineares Regressionsmodell in R anpassen, nimmt das Modell die folgende Form an:
Y = β 0 + β 1 X + … + β i
wobei ϵ ein von X unabhängiger Fehlerterm ist.
Unabhängig davon, wie X verwendet werden kann, um die Werte von Y vorherzusagen, wird es immer zufällige Fehler im Modell geben. Eine Möglichkeit, die Streuung dieses Zufallsfehlers zu messen, ist die Verwendung des Reststandardfehlers , mit dem sich die Standardabweichung der Residuen ϵ messen lässt.
Der verbleibende Standardfehler eines Regressionsmodells wird wie folgt berechnet:
Residueller Standardfehler = √ SS- Residuen / df- Residuen
Gold:
- Residuen SS : Die Residualsumme der Quadrate.
- Residual df : Restfreiheitsgrade, berechnet als n – k – 1, wobei n = Gesamtzahl der Beobachtungen und k = Gesamtzahl der Modellparameter.
Es gibt drei Methoden, mit denen wir den verbleibenden Standardfehler eines Regressionsmodells in R berechnen können.
Methode 1: Analysieren Sie die Modellzusammenfassung
Die erste Möglichkeit, den Reststandardfehler zu ermitteln, besteht darin, einfach ein lineares Regressionsmodell anzupassen und dann den Befehl summary() zu verwenden, um die Modellergebnisse zu erhalten. Suchen Sie dann einfach nach „Reststandardfehler“ am Ende der Ausgabe:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Wir können sehen, dass der verbleibende Standardfehler 3,127 beträgt.
Methode 2: Verwenden Sie eine einfache Formel
Eine andere Möglichkeit, den Reststandardfehler (RSE) zu ermitteln, besteht darin, ein lineares Regressionsmodell anzupassen und dann die folgende Formel zur Berechnung des RSE zu verwenden:
sqrt( deviance (model)/df. residual (model))
So implementieren Sie diese Formel in R:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
Wir können sehen, dass der verbleibende Standardfehler 3,126601 beträgt.
Methode 3: Verwenden Sie eine Schritt-für-Schritt-Formel
Eine andere Möglichkeit, den Reststandardfehler zu ermitteln, besteht darin, ein lineares Regressionsmodell anzupassen und dann mithilfe eines schrittweisen Ansatzes jede einzelne Komponente der RSE-Formel zu berechnen:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
Wir können sehen, dass der verbleibende Standardfehler 3,126601 beträgt.
So interpretieren Sie den Reststandardfehler
Wie bereits erwähnt, ist der Reststandardfehler (RSE) eine Möglichkeit, die Standardabweichung der Residuen in einem Regressionsmodell zu messen.
Je niedriger der CSR-Wert, desto besser kann ein Modell die Daten anpassen (achten Sie jedoch auf eine Überanpassung ). Dies kann eine nützliche Metrik sein, wenn Sie zwei oder mehr Modelle vergleichen, um zu bestimmen, welches Modell am besten zu den Daten passt.
Zusätzliche Ressourcen
So interpretieren Sie den Reststandardfehler
So führen Sie eine multiple lineare Regression in R durch
So führen Sie eine Kreuzvalidierung der Modellleistung in R durch
So berechnen Sie die Standardabweichung in R