Como usar a função lm() em r para ajustar modelos lineares


A função lm() em R é usada para ajustar modelos de regressão linear.

Esta função usa a seguinte sintaxe básica:

lm(fórmula, dados,…)

Ouro:

  • fórmula: A fórmula do modelo linear (por exemplo, y ~ x1 + x2)
  • dados: o nome do bloco de dados que contém os dados

O exemplo a seguir mostra como usar esta função em R para fazer o seguinte:

  • Ajustar um modelo de regressão
  • Ver resumo de ajuste do modelo de regressão
  • Visualizar gráficos de diagnóstico de modelo
  • Trace o modelo de regressão ajustado
  • Faça previsões usando o modelo de regressão

Ajuste o modelo de regressão

O código a seguir mostra como usar a função lm() para ajustar um modelo de regressão linear em R:

 #define data
df = data. frame (x=c(1, 3, 3, 4, 5, 5, 6, 8, 9, 12),
                y=c(12, 14, 14, 13, 17, 19, 22, 26, 24, 22))

#fit linear regression model using 'x' as predictor and 'y' as response variable
model <- lm(y ~ x, data=df)

Mostrar resumo do modelo de regressão

Podemos então usar a função summary() para exibir o resumo do ajuste do modelo de regressão:

 #view summary of regression model
summary(model)

Call:
lm(formula = y ~ x, data = df)

Residuals:
    Min 1Q Median 3Q Max 
-4.4793 -0.9772 -0.4772 1.4388 4.6328 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 11.1432 1.9104 5.833 0.00039 ***
x 1.2780 0.2984 4.284 0.00267 ** 
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.929 on 8 degrees of freedom
Multiple R-squared: 0.6964, Adjusted R-squared: 0.6584 
F-statistic: 18.35 on 1 and 8 DF, p-value: 0.002675

Veja como interpretar os valores mais importantes do modelo:

  • Estatística F = 18,35, valor p correspondente = 0,002675. Como esse valor de p é inferior a 0,05, o modelo como um todo é estatisticamente significativo.
  • Múltiplo R ao quadrado = 0,6964. Isso nos diz que 69,64% da variação na variável resposta, y, pode ser explicada pela variável preditora, x.
  • Coeficiente estimado de x : 1,2780. Isso nos diz que cada aumento unitário adicional em x está associado a um aumento médio de 1,2780 em y.

Podemos então usar as estimativas dos coeficientes da saída para escrever a equação de regressão estimada:

y = 11,1432 + 1,2780*(x)

Bônus : você pode encontrar um guia completo para interpretar cada valor da saída da regressão em R aqui .

Visualizar gráficos de diagnóstico de modelo

Podemos então usar a função plot() para traçar os gráficos de diagnóstico do modelo de regressão:

 #create diagnostic plots
plot(model) 

Esses gráficos nos permitem analisar os resíduos do modelo de regressão para determinar se o modelo é apropriado para uso nos dados.

Consulte este tutorial para obter uma explicação completa de como interpretar os gráficos de diagnóstico de um modelo em R.

Trace o modelo de regressão ajustado

Podemos usar a função abline() para traçar o modelo de regressão ajustado:

 #create scatterplot of raw data
plot(df$x, df$y, col=' red ', main=' Summary of Regression Model ', xlab=' x ', ylab=' y ')

#add fitted regression line
abline(model)

plotar lm() em R

Use o modelo de regressão para fazer previsões

Podemos usar a função predizer() para prever o valor da resposta para uma nova observação:

 #define new observation
new <- data. frame (x=c(5))

#use the fitted model to predict the value for the new observation
predict(model, newdata = new)

      1 
17.5332

O modelo prevê que esta nova observação terá um valor de resposta de 17,5332 .

Recursos adicionais

Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R
Como realizar a regressão stepwise em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *