Jak utworzyć zgrupowany wykres pudełkowy w r za pomocą ggplot2
Wykresy pudełkowe są przydatne do wizualizacji pięciocyfrowego podsumowania zbioru danych, które obejmuje:
- Minimum
- Pierwszy kwartyl
- Mediana
- Trzeci kwartyl
- Maksymalny
Powiązane: Delikatne wprowadzenie do wykresów pudełkowych
Na szczęście tworzenie wykresów pudełkowych w R jest łatwe przy użyciu biblioteki wizualizacji ggplot2 .
Obejmuje to również tworzenie wykresów pudełkowych pogrupowanych według określonej zmiennej w zbiorze danych. Załóżmy na przykład, że mamy następujący zbiór danych, który pokazuje wzrost wydajności 150 koszykarzy z trzech różnych drużyn w oparciu o dwa różne programy treningowe:
#define variables team=rep(c('A', 'B', 'C'), each =50) program=rep(c('low', 'high'), each =25) increase=seq(1:150)+sample(1:100, 100, replace= TRUE ) #create dataset using variables data=data.frame(team, program, increase) #view first six rows of dataset head(data) team program increase 1 A low 62 2 A low 37 3 A low 49 4 A low 60 5 A low 64 6 A low 105
Możemy użyć poniższego kodu, aby utworzyć wykresy pudełkowe przedstawiające wzrost efektywności zawodników, pogrupowane według drużyn i wypełnione na podstawie harmonogramu treningów:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot ()
Możemy użyć podobnej składni, aby utworzyć wykresy pudełkowe przedstawiające wzrost efektywności zawodnika, pogrupowane według programu treningowego i wypełnione według zespołu:
library (ggplot2) ggplot(data, aes(x=program, y=increase, fill=team)) + geom_boxplot ()
Podobną alternatywą jest użycie facetingu , w którym każda podgrupa jest wyświetlana w swoim własnym panelu:
library (ggplot2) ggplot(data, aes(x=team, y=increase, fill=program)) + geom_boxplot () + facet_wrap (~program)
W zależności od danych, z którymi pracujesz, tworzenie aspektów może, ale nie musi, spełniać Twoje potrzeby w zakresie wizualizacji.
Dodatkowe zasoby
Jak usunąć wartości odstające z wykresów pudełkowych w R
Jak tworzyć wykresy obok siebie w ggplot2
Kompletny przewodnik po najlepszych motywach ggplot2