Come creare grafici con variabili aggiunte in r
Nelle statistiche, i grafici delle variabili aggiunte sono grafici individuali che mostrano la relazione tra una variabile di risposta e una variabile predittrice in un modello di regressione lineare multipla, controllando al tempo stesso la presenza di altre variabili predittive nel modello.
Nota: a volte questi grafici sono anche chiamati “grafici di regressione parziale”.
Questo tipo di grafico ci consente di osservare la relazione tra ogni singola variabile predittrice e la variabile di risposta in un modello mantenendo costanti le altre variabili predittive.
Per creare grafici di variabili aggiunte in R, possiamo utilizzare la funzione avPlots() dal pacchetto auto :
#load car package library (car) #fit multiple linear regression model model <- lm(y ~ x1 + x2 + ..., data = df) #create added variable plots avPlots(model)
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: aggiunta di grafici variabili in R
Supponiamo di adattare il seguente modello di regressione lineare multipla in R, utilizzando i dati del set di dati mtcars :
#fit multiple linear regression model model <- lm(mpg ~ disp + hp + drat, data = mtcars) #view summary of model summary(model) Call: lm(formula = mpg ~ disp + hp + drat, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.1225 -1.8454 -0.4456 1.1342 6.4958 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 19.344293 6.370882 3.036 0.00513 ** available -0.019232 0.009371 -2.052 0.04960 * hp -0.031229 0.013345 -2.340 0.02663 * drat 2.714975 1.487366 1.825 0.07863 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.008 on 28 degrees of freedom Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
Per visualizzare la relazione tra la variabile di risposta “mpg” e ogni singola variabile predittrice nel modello, possiamo produrre grafici di variabili aggiunte utilizzando la funzione avPlots() :
#load car package
library (car)
#produce added variable plots
avPlots(model)
Ecco come interpretare ciascuna trama:
- L’asse x mostra una singola variabile predittrice e l’asse y mostra la variabile di risposta.
- La linea blu mostra l’associazione tra la variabile predittore e la variabile di risposta, mantenendo costante il valore di tutte le altre variabili predittive .
- I punti etichettati in ciascun grafico rappresentano le due osservazioni con i residui maggiori e le due osservazioni con la leva parziale maggiore.
Si noti che l’angolo della linea in ciascun grafico corrisponde al segno del coefficiente dell’equazione di regressione stimata.
Ad esempio, ecco i coefficienti stimati per ciascuna variabile predittrice nel modello:
- visualizzazione: -0,019232
- cap: -0,031229
- data: 2.714975
Si noti che l’angolo della linea è positivo nel grafico della variabile aggiunta per drat mentre è negativo per disp e hp , che corrisponde ai segni dei loro coefficienti stimati:
Questi grafici ci consentono di visualizzare facilmente la relazione tra ogni singola variabile predittrice e la variabile di risposta.
Risorse addizionali
Come eseguire una regressione lineare semplice in R
Come eseguire la regressione lineare multipla in R
Come eseguire la regressione logistica in R