Comment tracer une ligne de régression linéaire dans ggplot2 (avec exemples)
Vous pouvez utiliser la bibliothèque de visualisation R ggplot2 pour tracer un modèle de régression linéaire ajusté en utilisant la syntaxe de base suivante :
ggplot(data,aes(x, y)) +
geom_point() +
geom_smooth(method='lm')
L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.
Exemple : tracer une ligne de régression linéaire dans ggplot2
Supposons que nous ajustions un modèle de régression linéaire simple à l’ensemble de données suivant :
#create dataset data <- data.frame(y=c(6, 7, 7, 9, 12, 13, 13, 15, 16, 19, 22, 23, 23, 25, 26), x=c(1, 2, 2, 3, 4, 4, 5, 6, 6, 8, 9, 9, 11, 12, 12)) #fit linear regression model to dataset and view model summary model <- lm(y~x, data=data) summary(model) Call: lm(formula = y ~ x, data = data) Residuals: Min 1Q Median 3Q Max -1.4444 -0.8013 -0.2426 0.5978 2.2363 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 4.20041 0.56730 7.404 5.16e-06 *** x 1.84036 0.07857 23.423 5.13e-12 *** --- Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: 1.091 on 13 degrees of freedom Multiple R-squared: 0.9769, Adjusted R-squared: 0.9751 F-statistic: 548.7 on 1 and 13 DF, p-value: 5.13e-12
Le code suivant montre comment visualiser le modèle de régression linéaire ajusté :
library(ggplot2) #create plot to visualize fitted linear regression model ggplot(data,aes(x, y)) + geom_point() + geom_smooth(method='lm')
Par défaut, ggplot2 ajoute des lignes d’erreur standard au graphique. Vous pouvez les désactiver en utilisant l’argument se=FALSE comme suit :
library(ggplot2) #create regression plot with no standard error lines ggplot(data,aes(x, y)) + geom_point() + geom_smooth(method='lm', se=FALSE)
Enfin, nous pouvons personnaliser certains aspects du graphique pour le rendre plus attrayant visuellement :
library(ggplot2) #create regression plot with customized style ggplot(data,aes(x, y)) + geom_point() + geom_smooth(method='lm', se=FALSE, color='turquoise4') + theme_minimal() + labs(x='X Values', y='Y Values', title='Linear Regression Plot') + theme(plot.title = element_text(hjust=0.5, size=20, face='bold'))
Reportez-vous à cet article pour un guide complet des meilleurs thèmes ggplot2.
Ressources additionnelles
Une introduction à la régression linéaire multiple dans R
Comment tracer un intervalle de confiance dans R