Hoe u toegevoegde variabele plots kunt maken in r
In de statistiek zijn toegevoegde variabele plots individuele plots die de relatie weergeven tussen eenresponsvariabele en een voorspellende variabele in een meervoudig lineair regressiemodel, terwijl wordt gecontroleerd voor de aanwezigheid van andere voorspellende variabelen in het model.
Opmerking: soms worden deze plots ook wel ‚partiële regressieplots‘ genoemd.
Met dit type plot kunnen we de relatie tussen elke individuele voorspellende variabele en de responsvariabele in een model observeren, terwijl andere voorspellende variabelen constant worden gehouden.
Om plots van toegevoegde variabelen in R te maken, kunnen we de functie avPlots() uit het car- pakket gebruiken:
#load car package library (car) #fit multiple linear regression model model <- lm(y ~ x1 + x2 + ..., data = df) #create added variable plots avPlots(model)
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: Variabele plots toevoegen in R
Stel dat we het volgende meervoudige lineaire regressiemodel in R passen, met behulp van gegevens uit de mtcars- dataset:
#fit multiple linear regression model model <- lm(mpg ~ disp + hp + drat, data = mtcars) #view summary of model summary(model) Call: lm(formula = mpg ~ disp + hp + drat, data = mtcars) Residuals: Min 1Q Median 3Q Max -5.1225 -1.8454 -0.4456 1.1342 6.4958 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 19.344293 6.370882 3.036 0.00513 ** available -0.019232 0.009371 -2.052 0.04960 * hp -0.031229 0.013345 -2.340 0.02663 * drat 2.714975 1.487366 1.825 0.07863 . --- Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 3.008 on 28 degrees of freedom Multiple R-squared: 0.775, Adjusted R-squared: 0.7509 F-statistic: 32.15 on 3 and 28 DF, p-value: 3.28e-09
Om de relatie tussen de responsvariabele „mpg“ en elke individuele voorspellende variabele in het model te visualiseren, kunnen we grafieken van toegevoegde variabelen maken met behulp van de functie avPlots() :
#load car package
library (car)
#produce added variable plots
avPlots(model)
Zo interpreteer je elk plot:
- Op de x-as wordt een enkele voorspellende variabele weergegeven en op de y-as de responsvariabele.
- De blauwe lijn toont het verband tussen de voorspellende variabele en de responsvariabele, terwijl de waarde van alle andere voorspellende variabelen constant wordt gehouden .
- De gelabelde punten in elke grafiek vertegenwoordigen de twee waarnemingen met de grootste residuen en de twee waarnemingen met de grootste gedeeltelijke invloed.
Merk op dat de hoek van de lijn in elke grafiek overeenkomt met het teken van de coëfficiënt van de geschatte regressievergelijking.
Hier volgen bijvoorbeeld de geschatte coëfficiënten voor elke voorspellende variabele in het model:
- weergave: -0,019232
- ch: -0,031229
- datum: 2.714975
Merk op dat de hoek van de lijn positief is in de toegevoegde variabele grafiek voor drat , terwijl deze negatief is voor disp en hp , wat overeenkomt met de tekens van hun geschatte coëfficiënten:
Met deze grafieken kunnen we eenvoudig de relatie tussen elke individuele voorspellende variabele en de responsvariabele visualiseren.
Aanvullende bronnen
Hoe eenvoudige lineaire regressie uit te voeren in R
Hoe meervoudige lineaire regressie uit te voeren in R
Hoe logistische regressie uit te voeren in R