Jak usunąć na z działki w ggplot2 (z przykładem)
Możesz użyć następującej podstawowej składni, aby usunąć wartości NA z wykresu w ggplot2:
library (ggplot2) ggplot(data=subset(df, ! is. na (this_column)), aes(x=this_column)) + geom_bar()
W tym konkretnym przykładzie tworzony jest wykres słupkowy i usuwane są wszystkie wiersze z ramki danych, w których w kolumnie o nazwie this_column pojawia się wartość NA.
Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.
Przykład: usuń NA z działki w ggplot2
Załóżmy, że mamy następującą ramkę danych zawierającą informację o liczbie punktów zdobytych przez koszykarzy z różnych drużyn:
#create data frame df <- data. frame (team=c('A', 'A', NA, NA, 'B', 'B', 'B', 'B'), dots=c(22, 29, 14, 8, 5, 12, 26, 36)) #view data frame df team points 1 to 22 2 to 29 3 <NA> 14 4 <NA> 8 5 B 5 6 B 12 7 B 26 8 B 36
Załóżmy teraz, że próbujemy utworzyć wykres słupkowy w ggplot2, aby zwizualizować liczbę wystąpień każdego zespołu:
library (ggplot2) #create bar plot to visualize occurrences by team ggplot(df, aes(x=team)) + geom_bar()
Należy pamiętać, że wykres automatycznie tworzy słupek wyświetlający wystąpienia wartości NA w kolumnie Zespół .
Aby usunąć ten słupek z wykresu, możemy użyć funkcji subset() w celu podzbioru ramki danych tak, aby zawierała tylko te wiersze, w których wartość w kolumnie zespołu nie jest NA:
library (ggplot2) #create bar plot to visualize occurrences by team and remove NA ggplot(data=subset(df, ! is. na (team)), aes(x=team)) + geom_bar()
Ten wykres słupkowy nadal wyświetla liczbę wystąpień wartości „A” i „B” w kolumnie Zespół , ale nie zawiera już paska wyświetlającego liczbę wystąpień wartości NA.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w ggplot2:
Jak usunąć etykiety osi w ggplot2
Jak usunąć legendę w ggplot2
Jak usunąć linie siatki w ggplot2