Jak utworzyć wykres pareto w r (krok po kroku)
Wykres Pareto to rodzaj wykresu, który przedstawia częstotliwości różnych kategorii, a także skumulowane częstotliwości kategorii.
W tym samouczku przedstawiono krok po kroku przykład tworzenia wykresu Pareto w języku R.
Krok 1: Utwórz dane
Załóżmy, że przeprowadzamy ankietę, w której prosimy 350 różnych osób o wskazanie ich ulubionej marki płatków śniadaniowych spośród marek A, B, C, D i E.
Poniższy zbiór danych przedstawia łączną liczbę głosów oddanych na każdą markę:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Krok 2: Utwórz wykres Pareto
Aby utworzyć wykres Pareto i zwizualizować wyniki tej ankiety, możemy skorzystać z funkcji pareto.chart() z pakietu qcc :
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
Tabela wyników pokazuje nam częstotliwość i skumulowaną częstotliwość każdej marki. Na przykład:
- Marka A częstotliwość: 140 | Częstotliwość skumulowana: 140
- Częstotliwość marki B: 97 | Skumulowana częstotliwość A, B: 237
- Częstotliwość znaku C: 58 | Skumulowana częstotliwość A, B, C: 295
I tak dalej.
Krok 3: Edytuj wykres Pareto (opcjonalnie)
Poniższy kod pokazuje, jak zmodyfikować tytuł wykresu oraz zastosowaną paletę kolorów:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
Pełną listę dostępnych palet kolorów można znaleźć w tej ściągawce R Color .
Dodatkowe zasoby
Jak tworzyć tabele częstości w R
Jak utworzyć histogram częstotliwości względnej w R
Jak obliczyć sumy skumulowane w R