Como criar gráficos de variáveis anexadas em r
Nas estatísticas, os gráficos de variáveis adicionadas são gráficos individuais que exibem a relação entre uma variável de resposta e uma variável preditora em um modelo de regressão linear múltipla, enquanto controlam a presença de outras variáveis preditoras no modelo.
Nota: Às vezes, esses gráficos também são chamados de “gráficos de regressão parcial”.
Este tipo de gráfico nos permite observar a relação entre cada variável preditora individual e a variável de resposta em um modelo, enquanto mantém outras variáveis preditoras constantes.
Para criar gráficos de variáveis anexadas em R, podemos usar a função avPlots() do pacote car :
#load car package library (car) #fit multiple linear regression model model <- lm(y ~ x1 + x2 + ..., data = df) #create added variable plots avPlots(model)
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: Adicionando Gráficos de Variáveis em R
Suponha que ajustamos o seguinte modelo de regressão linear múltipla em R, usando dados do conjunto de dados mtcars :
#fit multiple linear regression model model <- lm(mpg ~ disp + hp + drat, data = mtcars) #view summary of model summary(model) Call: lm(formula = mpg ~ disp + hp + drat, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.1225 -1.8454 -0.4456 1.1342 6.4958 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 19.344293 6.370882 3.036 0.00513 ** available -0.019232 0.009371 -2.052 0.04960 * hp -0.031229 0.013345 -2.340 0.02663 * drat 2.714975 1.487366 1.825 0.07863 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.008 on 28 degrees of freedom Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
Para visualizar a relação entre a variável de resposta “mpg” e cada variável preditora individual no modelo, podemos produzir gráficos de variáveis adicionadas usando a função avPlots() :
#load car package
library (car)
#produce added variable plots
avPlots(model)
Veja como interpretar cada enredo:
- O eixo x exibe uma única variável preditora e o eixo y exibe a variável de resposta.
- A linha azul mostra a associação entre a variável preditora e a variável resposta, enquanto mantém constante o valor de todas as outras variáveis preditoras .
- Os pontos rotulados em cada gráfico representam as duas observações com os maiores resíduos e as duas observações com a maior alavancagem parcial.
Observe que o ângulo da reta em cada gráfico corresponde ao sinal do coeficiente da equação de regressão estimada.
Por exemplo, aqui estão os coeficientes estimados para cada variável preditora no modelo:
- exibição: -0,019232
- canal: -0,031229
- data: 2.714975
Observe que o ângulo da linha é positivo no gráfico da variável adicionada para drat enquanto é negativo para disp e hp , o que corresponde aos sinais de seus coeficientes estimados:
Esses gráficos nos permitem visualizar facilmente a relação entre cada variável preditora individual e a variável de resposta.
Recursos adicionais
Como realizar regressão linear simples em R
Como realizar regressão linear múltipla em R
Como realizar regressão logística em R