Jak utworzyć wykres słupkowy w r


Wykres paskowy to rodzaj wykresu, na którym dane liczbowe są wyświetlane w jednym wstędze. Podobnie jak wykresy pudełkowe , wykresy słupkowe mogą pomóc w wizualizacji rozkładu danych. Wykresy słupkowe mogą być dobrą alternatywą dla wykresów pudełkowych, gdy próbki są małe, dzięki czemu można zobaczyć poszczególne punkty danych.

W tym samouczku wyjaśniono, jak utworzyć wykres paskowy w języku R przy użyciu wbudowanej funkcji stripchart() .

Funkcja stripchart().

Podstawowa składnia tworzenia wykresu słupkowego w R to:

stripchart(x, metoda, jitter, main, xlab, ylab, col, pch, pionowo, group.names)

  • x : wektor numeryczny lub lista wektorów numerycznych do wykreślenia. Jest to jedyny argument wymagany do stworzenia fabuły.
  • metoda : metoda używana do oddzielania punktów o identycznych wartościach. Domyślna metoda „overplot” powoduje, że te punkty są nakładane, ale możliwe jest określenie „jitter”, aby poruszyć punkty, lub „stos”, aby ułożyć punkty.
  • jitter : Gdy używana jest metoda = „jitter”, określa wielkość jittera, którą należy zastosować.
  • główne: tytuł wykresu
  • xlab : etykieta osi X
  • ylab : etykieta osi Y
  • col : kolor punktów wykresu
  • pch : kształt punktów wykresu
  • pionowo : gdy pionowo ma wartość „TRUE”, ścieżka jest domyślnie rysowana pionowo, a nie poziomo
  • group.names : etykiety grup do wydrukowania obok wykresu, jeśli wykreślonych jest wiele wektorów numerycznych.

Wykres słupkowy dla pojedynczego wektora cyfrowego

W poniższym przykładzie zastosowano osadzoną tęczówkę zestawu danych R w celu utworzenia wykresu słupkowego dla pojedynczego wektora liczbowego.

 #view first six rows of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Poniższy kod tworzy wykres pasma podstawowego dla zmiennej Sepal.Length :

 stripchart(iris$Sepal.Length)

Możemy także dodać dodatkowe argumenty, aby dodać tytuł i etykietę na osi x, zmienić kolor punktów, zmienić kształt punktów oraz zastosować metodę „jitter”, aby poszczególne punkty nie nachodziły na siebie:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Zamiast mieszać punkty, możemy je „nakładać” na siebie:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
method = 'stack' )

Możemy również wyświetlić wykres w pionie zamiast domyślnego w poziomie i zmienić etykietę osi tak, aby znajdowała się na osi Y:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
ylab = 'Sepal Length' ,
           col = 'red',
           pch = 1,
           method = 'jitter',
vertical = TRUE )

Wykres słupkowy dla wielu wektorów numerycznych

Możemy także narysować wiele wykresów paskowych na jednym wykresie, przekazując listę wektorów numerycznych.

Poniższy kod tworzy listę zawierającą zmienne Długość i Szerokość Sepal w zestawie danych tęczówki i tworzy wykres słupkowy dla każdej zmiennej na pojedynczym wykresie:

 #create list of variables
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)

#create plot that contains one strip chart per variable
stripchart(x,
           main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Podobnie jak w poprzednim przykładzie, możemy wybrać opcję wykreślania wykresów słupkowych w pionie zamiast domyślnego w poziomie:

 stripchart(x, main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
vertical = TRUE )

Dodatkowo możemy przekazać formułę w postaci y~x do funkcji stripchart() , gdzie y jest wektorem liczbowym pogrupowanym według wartości x .

Na przykład w zbiorze danych tęczówki moglibyśmy pogrupować dane według gatunków , które mają trzy różne wartości („setosa”, „versicolor” i „virginica”), a następnie wykreślić długość działek dla każdego gatunku na wykresie słupkowym:

 stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Aby wyświetlić pełną dokumentację funkcji stripchart() w R, po prostu wpisz:

 ?stripchart

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *