Jak usunąć wartości odstające z wykresów pudełkowych w r


Czasami możesz chcieć usunąć wartości odstające z wykresów pudełkowych w R.

W tym samouczku wyjaśniono, jak to zrobić, używając zarówno podstawowego R, jak i ggplot2 .

Usuń wartości odstające z wykresów pudełkowych w bazie R

Załóżmy, że mamy następujący zbiór danych:

 data <- c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48)

Poniższy kod pokazuje, jak utworzyć wykres pudełkowy dla tego zbioru danych w podstawowym R:

 boxplot(data)

Aby usunąć wartości odstające, możesz użyć argumentu konspektu=FALSE :

 boxplot(data, outline= FALSE ) 

Wykres pudełkowy z usuniętą wartością odstającą w R

Usuń wartości odstające z wykresów pudełkowych w ggplot2

Załóżmy, że mamy następujący zbiór danych:

 data <- data.frame(y=c(5, 8, 8, 12, 14, 15, 16, 19, 20, 22, 24, 25, 25, 26, 30, 48))

Poniższy kod pokazuje, jak utworzyć wykres pudełkowy przy użyciu biblioteki wizualizacji ggplot2:

 library (ggplot2)

ggplot(data, aes(y=y)) +
  geom_boxplot ()

Aby usunąć wartości odstające, możesz użyć argumentu outlier.shape=NA :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA )

Wykres pudełkowy ggplot2 z usuniętymi wartościami odstającymi

Zauważ, że ggplot2 nie dostosowuje automatycznie osi Y.

Aby dostosować oś Y, możesz użyć coord_cartesian :

 ggplot(data, aes(y=y)) +
geom_boxplot (outlier.shape = NA ) +
  coord_cartesian (ylim=c(5, 30)) 

boxplot ggplot2 bez wartości odstających

Oś Y ma teraz zakres od 5 do 30, jak określiliśmy za pomocą argumentu ylim() .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w ggplot2:

Jak ustawić limity osi w ggplot2
Jak tworzyć wykresy obok siebie w ggplot2
Jak oznaczyć wartości odstające na wykresach pudełkowych w ggplot2

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *