Как построить линию линейной регрессии в ggplot2 (с примерами)


Вы можете использовать библиотеку визуализации R ggplot2 для построения подобранной модели линейной регрессии, используя следующий базовый синтаксис:

 ggplot(data,aes(x, y)) +
  geom_point() +
  geom_smooth(method=' lm ')

В следующем примере показано, как использовать этот синтаксис на практике.

Пример: построение линии линейной регрессии в ggplot2

Предположим, мы подгоняем простую модель линейной регрессии к следующему набору данных:

 #create dataset
data <- data.frame(y=c(6, 7, 7, 9, 12, 13, 13, 15, 16, 19, 22, 23, 23, 25, 26),
                   x=c(1, 2, 2, 3, 4, 4, 5, 6, 6, 8, 9, 9, 11, 12, 12))

#fit linear regression model to dataset and view model summary
model <- lm(y~x, data=data)
summary(model)

Call:
lm(formula = y ~ x, data = data)

Residuals:
    Min 1Q Median 3Q Max 
-1.4444 -0.8013 -0.2426 0.5978 2.2363 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept) 4.20041 0.56730 7.404 5.16e-06 ***
x 1.84036 0.07857 23.423 5.13e-12 ***
---
Significant. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 1.091 on 13 degrees of freedom
Multiple R-squared: 0.9769, Adjusted R-squared: 0.9751 
F-statistic: 548.7 on 1 and 13 DF, p-value: 5.13e-12

Следующий код показывает, как визуализировать подобранную модель линейной регрессии:

 library (ggplot2)

#create plot to visualize fitted linear regression model
ggplot(data,aes(x, y)) +
  geom_point() +
  geom_smooth(method=' lm ') 

График линейной регрессии в ggplot2

По умолчанию ggplot2 добавляет на график стандартные линии ошибок. Вы можете отключить их, используя аргумент se=FALSE следующим образом:

 library (ggplot2)

#create regression plot with no standard error lines
ggplot(data,aes(x, y)) +
  geom_point() +
  geom_smooth(method=' lm ', se= FALSE ) 

линия регрессии ggplot2

Наконец, мы можем настроить некоторые аспекты диаграммы, чтобы сделать ее более визуально привлекательной:

 library (ggplot2)

#create regression plot with customized style
ggplot(data,aes(x, y)) +
  geom_point() +
  geom_smooth(method=' lm ', se= FALSE , color=' turquoise4 ') +
  theme_minimal() +
  labs(x=' X Values ', y=' Y Values ', title=' Linear Regression Plot ') +
  theme(plot.title = element_text(hjust=0.5, size=20, face=' bold ')) 

Пользовательская линия регрессии с использованием ggplot2 в R

В этой статье вы найдете полное руководство по лучшим темам ggplot2.

Дополнительные ресурсы

Введение в множественную линейную регрессию в R
Как построить доверительный интервал в R

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *