Як видалити na з графіка в ggplot2 (з прикладом)
Ви можете використовувати наступний базовий синтаксис, щоб видалити значення NA з діаграми в ggplot2:
library (ggplot2) ggplot(data=subset(df, ! is. na (this_column)), aes(x=this_column)) + geom_bar()
У цьому конкретному прикладі створюється стовпчаста діаграма та видаляються всі рядки з кадру даних, де значення NA відображається в стовпці під назвою this_column .
У наступному прикладі показано, як використовувати цей синтаксис на практиці.
Приклад: видаліть NA з графіка в ggplot2
Припустимо, що ми маємо такий кадр даних, що містить інформацію про кількість очок, набраних баскетболістами різних команд:
#create data frame df <- data. frame (team=c('A', 'A', NA, NA, 'B', 'B', 'B', 'B'), dots=c(22, 29, 14, 8, 5, 12, 26, 36)) #view data frame df team points 1 to 22 2 to 29 3 <NA> 14 4 <NA> 8 5 B 5 6 B 12 7 B 26 8 B 36
Тепер припустімо, що ми спробуємо створити гістограму в ggplot2, щоб візуалізувати кількість входжень кожної команди:
library (ggplot2) #create bar plot to visualize occurrences by team ggplot(df, aes(x=team)) + geom_bar()
Зауважте, що діаграма автоматично створює панель для відображення значень NA у стовпці Team .
Щоб видалити цю смужку з графіка, ми можемо використати функцію subset() , щоб підмножити фрейм даних, щоб включити лише ті рядки, де значення в стовпці team не NA:
library (ggplot2) #create bar plot to visualize occurrences by team and remove NA ggplot(data=subset(df, ! is. na (team)), aes(x=team)) + geom_bar()
Ця гістограма все ще відображає кількість входжень для значень «A» і «B» у стовпці «Команда» , але вона більше не містить стовпця для відображення кількості входжень для значень NA.
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові завдання в ggplot2:
Як видалити мітки осі в ggplot2
Як видалити легенду в ggplot2
Як видалити лінії сітки в ggplot2