Come calcolare l'errore standard residuo in r

Di Benjamin anderson Luglio 27, 2023 Guida 0 commenti

Ogni volta che adattiamo un modello di regressione lineare in R, il modello assume la forma seguente:

Y = β ₀ + β ₁ X + … + β _i

dove ϵ è un termine di errore indipendente da X.

Non importa come X possa essere utilizzato per prevedere i valori di Y, nel modello ci sarà sempre un errore casuale. Un modo per misurare la dispersione di questo errore casuale è utilizzare l’ errore standard residuo , che è un modo per misurare la deviazione standard dei residui ϵ.

L’errore standard residuo di un modello di regressione viene calcolato come segue:

Errore standard residuo = √ SS _residui / df _residui

Oro:

_Residui SS : La somma residua dei quadrati.
df _residuo : gradi di libertà residui, calcolati come n – k – 1 dove n = numero totale di osservazioni e k = numero totale di parametri del modello.

Esistono tre metodi che possiamo utilizzare per calcolare l’errore standard residuo di un modello di regressione in R.

Metodo 1: analizzare il riepilogo del modello

Il primo modo per ottenere l’errore standard residuo è semplicemente adattare un modello di regressione lineare e quindi utilizzare il comando summary() per ottenere i risultati del modello. Quindi cerca “errore standard residuo” nella parte inferiore dell’output:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Possiamo vedere che l’errore standard residuo è 3.127 .

Metodo 2: utilizzare una formula semplice

Un altro modo per ottenere l’errore standard residuo (RSE) è quello di adattare un modello di regressione lineare e quindi utilizzare la seguente formula per calcolare l’RSE:

 sqrt( deviance (model)/df. residual (model))

Ecco come implementare questa formula in R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

Possiamo vedere che l’errore standard residuo è 3.126601 .

Metodo 3: utilizzare una formula passo passo

Un altro modo per ottenere l’errore standard residuo è quello di adattare un modello di regressione lineare e quindi utilizzare un approccio passo passo per calcolare ogni singolo componente della formula RSE:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Possiamo vedere che l’errore standard residuo è 3.126601 .

Come interpretare l’errore standard residuo

Come accennato in precedenza, l’errore standard residuo (RSE) è un modo per misurare la deviazione standard dei residui in un modello di regressione.

Più basso è il valore CSR, migliore è la capacità del modello di adattare i dati (ma fai attenzione all’adattamento eccessivo ). Questa può essere una metrica utile da utilizzare quando si confrontano due o più modelli per determinare quale modello si adatta meglio ai dati.

Risorse addizionali

Come interpretare l’errore standard residuo
Come eseguire la regressione lineare multipla in R
Come eseguire la convalida incrociata per le prestazioni del modello in R
Come calcolare la deviazione standard in R

Informazioni sull'autore

Benjamin anderson

Ciao, sono Benjamin, un professore di statistica in pensione diventato insegnante dedicato di Statorials. Con una vasta esperienza e competenza nel campo della statistica, sono ansioso di condividere le mie conoscenze per potenziare gli studenti attraverso Statorials. Scopri di più