Comment tracer la ligne de meilleur ajustement dans R (avec exemples)
Vous pouvez utiliser l’une des méthodes suivantes pour tracer une ligne de meilleur ajustement dans R :
Méthode 1 : tracer la ligne du meilleur ajustement dans la base R
#create scatter plot of x vs. y plot(x, y) #add line of best fit to scatter plot abline(lm(y ~ x))
Méthode 2 : tracer la ligne la mieux adaptée dans ggplot2
library(ggplot2) #create scatter plot with line of best fit ggplot(df, aes(x=x, y=y)) + geom_point() + geom_smooth(method=lm, se=FALSE)
Les exemples suivants montrent comment utiliser chaque méthode dans la pratique.
Exemple 1 : tracer la ligne de meilleur ajustement dans la base R
Le code suivant montre comment tracer une ligne de meilleur ajustement pour un modèle de régression linéaire simple utilisant la base R :
#define data x <- c(1, 2, 3, 4, 5, 6, 7, 8) y <- c(2, 5, 6, 7, 9, 12, 16, 19) #create scatter plot of x vs. y plot(x, y) #add line of best fit to scatter plot abline(lm(y ~ x))
N’hésitez pas à modifier également le style des points et du trait :
#define data x <- c(1, 2, 3, 4, 5, 6, 7, 8) y <- c(2, 5, 6, 7, 9, 12, 16, 19) #create scatter plot of x vs. y plot(x, y, pch=16, col='red', cex=1.2) #add line of best fit to scatter plot abline(lm(y ~ x), col='blue' , lty='dashed')
Nous pouvons également utiliser le code suivant pour calculer rapidement la ligne de meilleur ajustement :
#find regression model coefficients
summary(lm(y ~ x))$coefficients
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.8928571 1.0047365 -0.888648 4.084029e-01
x 2.3095238 0.1989675 11.607544 2.461303e-05
La ligne de meilleur ajustement s’avère être : y = -0,89 + 2,31x .
Exemple 2 : tracer la ligne la mieux adaptée dans ggplot2
Le code suivant montre comment tracer une ligne la mieux ajustée pour un modèle de régression linéaire simple à l’aide du package de visualisation de données ggplot2 :
library(ggplot2)
#define data
df <- data.frame(x=c(1, 2, 3, 4, 5, 6, 7, 8),
y=c(2, 5, 6, 7, 9, 12, 16, 19))
#create scatter plot with line of best fit
ggplot(df, aes(x=x, y=y)) +
geom_point() +
geom_smooth(method=lm, se=FALSE)
N’hésitez pas à modifier également l’esthétique de l’intrigue :
library(ggplot2)
#define data
df <- data.frame(x=c(1, 2, 3, 4, 5, 6, 7, 8),
y=c(2, 5, 6, 7, 9, 12, 16, 19))
#create scatter plot with line of best fit
ggplot(df, aes(x=x, y=y)) +
geom_point(col='red', size=2) +
geom_smooth(method=lm, se=FALSE, col='purple', linetype='dashed') +
theme_bw()
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes dans R :
Comment effectuer une régression linéaire simple dans R
Comment effectuer une régression linéaire multiple dans R
Comment interpréter la sortie de régression dans R