Come calcolare l'errore standard residuo in r
Ogni volta che adattiamo un modello di regressione lineare in R, il modello assume la forma seguente:
Y = β 0 + β 1 X + … + β i
dove ϵ è un termine di errore indipendente da X.
Non importa come X possa essere utilizzato per prevedere i valori di Y, nel modello ci sarà sempre un errore casuale. Un modo per misurare la dispersione di questo errore casuale è utilizzare l’ errore standard residuo , che è un modo per misurare la deviazione standard dei residui ϵ.
L’errore standard residuo di un modello di regressione viene calcolato come segue:
Errore standard residuo = √ SS residui / df residui
Oro:
- Residui SS : La somma residua dei quadrati.
- df residuo : gradi di libertà residui, calcolati come n – k – 1 dove n = numero totale di osservazioni e k = numero totale di parametri del modello.
Esistono tre metodi che possiamo utilizzare per calcolare l’errore standard residuo di un modello di regressione in R.
Metodo 1: analizzare il riepilogo del modello
Il primo modo per ottenere l’errore standard residuo è semplicemente adattare un modello di regressione lineare e quindi utilizzare il comando summary() per ottenere i risultati del modello. Quindi cerca “errore standard residuo” nella parte inferiore dell’output:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Possiamo vedere che l’errore standard residuo è 3.127 .
Metodo 2: utilizzare una formula semplice
Un altro modo per ottenere l’errore standard residuo (RSE) è quello di adattare un modello di regressione lineare e quindi utilizzare la seguente formula per calcolare l’RSE:
sqrt( deviance (model)/df. residual (model))
Ecco come implementare questa formula in R:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
Possiamo vedere che l’errore standard residuo è 3.126601 .
Metodo 3: utilizzare una formula passo passo
Un altro modo per ottenere l’errore standard residuo è quello di adattare un modello di regressione lineare e quindi utilizzare un approccio passo passo per calcolare ogni singolo componente della formula RSE:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
Possiamo vedere che l’errore standard residuo è 3.126601 .
Come interpretare l’errore standard residuo
Come accennato in precedenza, l’errore standard residuo (RSE) è un modo per misurare la deviazione standard dei residui in un modello di regressione.
Più basso è il valore CSR, migliore è la capacità del modello di adattare i dati (ma fai attenzione all’adattamento eccessivo ). Questa può essere una metrica utile da utilizzare quando si confrontano due o più modelli per determinare quale modello si adatta meglio ai dati.
Risorse addizionali
Come interpretare l’errore standard residuo
Come eseguire la regressione lineare multipla in R
Come eseguire la convalida incrociata per le prestazioni del modello in R
Come calcolare la deviazione standard in R