Como calcular o erro padrão residual em r


Sempre que ajustamos um modelo de regressão linear em R, o modelo assume a seguinte forma:

Y = β 0 + β 1 X + … + β i

onde ϵ é um termo de erro independente de X.

Não importa como X pode ser usado para prever os valores de Y, sempre haverá erros aleatórios no modelo. Uma forma de medir a dispersão desse erro aleatório é utilizar o erro padrão residual , que é uma forma de medir o desvio padrão dos resíduos ϵ.

O erro padrão residual de um modelo de regressão é calculado da seguinte forma:

Erro padrão residual = √ resíduos SS / resíduos df

Ouro:

  • Resíduos SS : A soma residual dos quadrados.
  • df residual : graus de liberdade residuais, calculados como n – k – 1 onde n = número total de observações e k = número total de parâmetros do modelo.

Existem três métodos que podemos usar para calcular o erro padrão residual de um modelo de regressão em R.

Método 1: Analise o resumo do modelo

A primeira maneira de obter o erro padrão residual é simplesmente ajustar um modelo de regressão linear e então usar o comando summary() para obter os resultados do modelo. Em seguida, procure por “erro padrão residual” na parte inferior da saída:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#view model summary
summary(model)

Call:
lm(formula = mpg ~ disp + hp, data = mtcars)

Residuals:
    Min 1Q Median 3Q Max 
-4.7945 -2.3036 -0.8246 1.8582 6.9363 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 30.735904 1.331566 23.083 < 2nd-16 ***
available -0.030346 0.007405 -4.098 0.000306 ***
hp -0.024840 0.013385 -1.856 0.073679 .  
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 3.127 on 29 degrees of freedom
Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 
F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09

Podemos ver que o erro padrão residual é 3,127 .

Método 2: use uma fórmula simples

Outra forma de obter o erro padrão residual (RSE) é ajustar um modelo de regressão linear e depois usar a seguinte fórmula para calcular o RSE:

 sqrt( deviance (model)/df. residual (model))

Veja como implementar esta fórmula em R:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate residual standard error
sqrt( deviance (model)/df. residual (model))

[1] 3.126601

Podemos ver que o erro padrão residual é 3,126601 .

Método 3: use uma fórmula passo a passo

Outra forma de obter o erro padrão residual é ajustar um modelo de regressão linear e depois usar uma abordagem passo a passo para calcular cada componente individual da fórmula RSE:

 #load built-in mtcars dataset
data(mtcars)

#fit regression model
model <- lm(mpg~disp+hp, data=mtcars)

#calculate the number of model parameters - 1
k=length(model$ coefficients )-1

#calculate sum of squared residuals
SSE=sum(model$ residuals **2)

#calculate total observations in dataset
n=length(model$ residuals )

#calculate residual standard error
sqrt(SSE/(n-(1+k)))

[1] 3.126601

Podemos ver que o erro padrão residual é 3,126601 .

Como interpretar o erro padrão residual

Conforme mencionado anteriormente, o erro padrão residual (RSE) é uma forma de medir o desvio padrão dos resíduos em um modelo de regressão.

Quanto menor o valor de CSR, melhor o modelo será capaz de ajustar os dados (mas tenha cuidado com o overfitting ). Esta pode ser uma métrica útil para usar ao comparar dois ou mais modelos para determinar qual modelo melhor se ajusta aos dados.

Recursos adicionais

Como interpretar o erro padrão residual
Como realizar regressão linear múltipla em R
Como fazer validação cruzada para desempenho do modelo em R
Como calcular o desvio padrão em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *