Jak utworzyć wykres barplotowy w ggplot2 z wieloma zmiennymi
Wykres słupkowy jest przydatny do wizualizacji ilości różnych zmiennych kategorycznych.
Czasami chcemy stworzyć wykres słupkowy, który wizualizuje ilości zmiennych kategorycznych w podziale na podgrupy.
Na przykład możemy chcieć wizualizować całkowitą sprzedaż popcornu i napojów gazowanych na trzech różnych stadionach sportowych. W tym samouczku przedstawiono krok po kroku przykład tworzenia następującego wykresu słupkowego z wieloma zmiennymi:
Krok 1: Utwórz dane
Najpierw utwórzmy ramkę danych do przechowywania naszych danych:
#createdata df <- data.frame(stadium= rep (c(' A ', ' B ', ' C '), each =4), food= rep (c(' popcorn ', ' soda '), times =6), sales=c(4, 5, 6, 8, 9, 12, 7, 9, 9, 11, 14, 13)) #viewdata df stadium food sales 1 A popcorn 4 2 A soda 5 3 A popcorn 6 4 A soda 8 5 B popcorn 9 6 B soda 12 7 B popcorn 7 8 B soda 9 9 C popcorn 9 10 C soda 11 11 C popcorn 14 12 C soda 13
Krok 2: Utwórz wykres słupkowy z wieloma zmiennymi
Poniższy kod pokazuje, jak utworzyć wykres słupkowy z wieloma zmiennymi przy użyciu funkcji geom_bar() do tworzenia słupków i argumentu „unikaj” , aby określić, że słupki w każdej grupie powinny „unikać” i być wyświetlane obok siebie.
ggplot(df, aes (fill=food, y=sales, x=stadium)) + geom_bar(position=' dodge ', stat=' identity ')
Różne etapy – A, B i C – są wyświetlane wzdłuż osi X, a odpowiadająca im sprzedaż popcornu i napojów gazowanych (w tysiącach) jest wyświetlana wzdłuż osi Y.
Krok 3: Zmień estetykę Barplotu
Poniższy kod pokazuje, jak dodać tytuł, zmienić etykiety osi i dostosować kolory na wykresie słupkowym:
ggplot(df, aes (fill=food, y=sales, x=stadium)) + geom_bar(position=' dodge ', stat=' identity ') + ggtitle(' Sales by Stadium ') + xlab(' Stadium ') + ylab(' Sales (in thousands) ') + scale_fill_manual(' Product ', values=c(' coral2 ',' steelblue '))
Dodatkowe zasoby
Jak zmienić tytuł legendy w ggplot2
Jak zmienić rozmiar legendy w ggplot2
Kompletny przewodnik po najlepszych motywach ggplot2