Як додати смуги помилок до діаграм у r (з прикладами)
Ви можете використовувати наступний базовий синтаксис, щоб додати смужки помилок до гістограми в R:
ggplot(df) + geom_bar( aes (x=x, y=y), stat=' identity ') + geom_errorbar( aes (x=x, ymin=y-sd, ymax=y+sd), width= 0.4 )
Наступні приклади показують, як використовувати цю функцію на практиці.
Приклад 1: додайте рядки помилок, використовуючи підсумкові дані
Припустімо, що ми маємо наступний кадр даних у R, який відображає підсумкову статистику для п’яти категорій:
#create data frame df <- data. frame (category=c('A', 'B', 'C', 'D', 'E'), value=c(12, 17, 30, 22, 19), sd=c(4, 5, 7, 4, 2)) #view data frame df category value sd 1 to 12 4 2 B 17 5 3 C 30 7 4 D 22 4 5 E 19 2
Ми можемо використати такий код, щоб створити гістограму зі смужками помилок для візуалізації цих даних:
library (ggplot2) #create bar plot with error bars ggplot(df) + geom_bar( aes (x=category, y=value), stat=' identity ', fill=' steelblue ') + geom_errorbar( aes (x=category, ymin=value-sd, ymax=value+sd), width= 0.4 )
Не соромтеся використовувати наступні аргументи, щоб змінити вигляд панелей помилок:
- ширина : ширина смуг помилок
- size : товщина смужок помилок
- колір : колір смужок помилок
Наприклад:
library (ggplot2) #create bar plot with custom error bars ggplot(df) + geom_bar( aes (x=category, y=value), stat=' identity ', fill=' steelblue ') + geom_errorbar( aes (x=category, ymin=value-sd, ymax=value+sd), width= 0.3 , size= 2.3 , color=' red ')
Приклад 2: додайте рядки помилок за допомогою необроблених даних
Скажімо, у нас є такий фрейм даних, який показує необроблені дані для п’яти різних категорій:
#make this example reproducible set. seeds (0) #create data frame df <- data. frame (category=rep(c('A', 'B', 'C', 'D', 'E'), each= 10 ), value=runif(50, 10, 20)) #view first six rows of data frame head(df) category value 1 A 18.96697 2 A 12.65509 3 A 13.72124 4 A 15.72853 5 A 19.08208 6 A 12.01682
У наступному коді показано, як узагальнити дані, а потім створити гістограму зі смужками помилок:
library (dplyr) library (ggplot2) #summarize mean and sd for each category df_summary <- df %>% group_by(category) %>% summarize(mean=mean(value), sd=sd(value)) #view summary data df_summary # A tibble: 5 x 3 category mean sd 1 A 16.4 2.80 2B 14.9 2.99 3 C 14.6 3.25 4 D 15.2 2.48 5 E 15.8 2.41 #create bar plot with error bars ggplot(df_summary) + geom_bar( aes (x=category, y=mean), stat=' identity ', fill=' steelblue ') + geom_errorbar( aes (x=category, ymin=mean-sd, ymax=mean+sd), width= 0.3 , color=' red ')
Додаткові ресурси
У наступних посібниках пояснюється, як створювати інші типові візуалізації даних у R:
Як побудувати кілька коробкових графіків у R
Як побудувати кілька гістограм у R
Як намалювати кілька ліній у R