Como calcular o erro padrão residual em r
Sempre que ajustamos um modelo de regressão linear em R, o modelo assume a seguinte forma:
Y = β 0 + β 1 X + … + β i
onde ϵ é um termo de erro independente de X.
Não importa como X pode ser usado para prever os valores de Y, sempre haverá erros aleatórios no modelo. Uma forma de medir a dispersão desse erro aleatório é utilizar o erro padrão residual , que é uma forma de medir o desvio padrão dos resíduos ϵ.
O erro padrão residual de um modelo de regressão é calculado da seguinte forma:
Erro padrão residual = √ resíduos SS / resíduos df
Ouro:
- Resíduos SS : A soma residual dos quadrados.
- df residual : graus de liberdade residuais, calculados como n – k – 1 onde n = número total de observações e k = número total de parâmetros do modelo.
Existem três métodos que podemos usar para calcular o erro padrão residual de um modelo de regressão em R.
Método 1: Analise o resumo do modelo
A primeira maneira de obter o erro padrão residual é simplesmente ajustar um modelo de regressão linear e então usar o comando summary() para obter os resultados do modelo. Em seguida, procure por “erro padrão residual” na parte inferior da saída:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #view model summary summary(model) Call: lm(formula = mpg ~ disp + hp, data = mtcars) Residuals: Min 1Q Median 3Q Max -4.7945 -2.3036 -0.8246 1.8582 6.9363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 30.735904 1.331566 23.083 < 2nd-16 *** available -0.030346 0.007405 -4.098 0.000306 *** hp -0.024840 0.013385 -1.856 0.073679 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.127 on 29 degrees of freedom Multiple R-squared: 0.7482, Adjusted R-squared: 0.7309 F-statistic: 43.09 on 2 and 29 DF, p-value: 2.062e-09
Podemos ver que o erro padrão residual é 3,127 .
Método 2: use uma fórmula simples
Outra forma de obter o erro padrão residual (RSE) é ajustar um modelo de regressão linear e depois usar a seguinte fórmula para calcular o RSE:
sqrt( deviance (model)/df. residual (model))
Veja como implementar esta fórmula em R:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate residual standard error sqrt( deviance (model)/df. residual (model)) [1] 3.126601
Podemos ver que o erro padrão residual é 3,126601 .
Método 3: use uma fórmula passo a passo
Outra forma de obter o erro padrão residual é ajustar um modelo de regressão linear e depois usar uma abordagem passo a passo para calcular cada componente individual da fórmula RSE:
#load built-in mtcars dataset data(mtcars) #fit regression model model <- lm(mpg~disp+hp, data=mtcars) #calculate the number of model parameters - 1 k=length(model$ coefficients )-1 #calculate sum of squared residuals SSE=sum(model$ residuals **2) #calculate total observations in dataset n=length(model$ residuals ) #calculate residual standard error sqrt(SSE/(n-(1+k))) [1] 3.126601
Podemos ver que o erro padrão residual é 3,126601 .
Como interpretar o erro padrão residual
Conforme mencionado anteriormente, o erro padrão residual (RSE) é uma forma de medir o desvio padrão dos resíduos em um modelo de regressão.
Quanto menor o valor de CSR, melhor o modelo será capaz de ajustar os dados (mas tenha cuidado com o overfitting ). Esta pode ser uma métrica útil para usar ao comparar dois ou mais modelos para determinar qual modelo melhor se ajusta aos dados.
Recursos adicionais
Como interpretar o erro padrão residual
Como realizar regressão linear múltipla em R
Como fazer validação cruzada para desempenho do modelo em R
Como calcular o desvio padrão em R