Een pareto-diagram maken in r (stap voor stap)
Een Pareto-diagram is een soort diagram dat de frequenties van verschillende categorieën weergeeft, evenals de cumulatieve frequenties van de categorieën.
Deze zelfstudie biedt een stapsgewijs voorbeeld van het maken van een Pareto-diagram in R.
Stap 1: Creëer de gegevens
Stel dat we een enquête houden waarin we 350 verschillende mensen vragen hun favoriete ontbijtgranenmerk te identificeren tussen de merken A, B, C, D en E.
De volgende dataset toont het totale aantal stemmen voor elk merk:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Stap 2: Maak het Pareto-diagram
Om een Pareto-diagram te maken om de resultaten van deze enquête te visualiseren, kunnen we de functie pareto.chart() uit het qcc- pakket gebruiken:
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
De outputtabel toont ons de frequentie en cumulatieve frequentie van elk merk. Bijvoorbeeld:
- Merk A frequentie: 140 | Cumulatieve frequentie: 140
- Merk B-frequentie: 97 | Cumulatieve frequentie van A, B: 237
- C-markeringsfrequentie: 58 | Cumulatieve frequentie van A, B, C: 295
Enzovoort.
Stap 3: Bewerk het Pareto-diagram (optioneel)
De volgende code laat zien hoe u de titel van het diagram en het gebruikte kleurenpalet kunt wijzigen:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
Een volledige lijst met beschikbare kleurenpaletten vindt u in dit R Color-spiekbriefje .
Aanvullende bronnen
Hoe frequentietabellen te maken in R
Hoe maak je een relatief frequentiehistogram in R
Hoe cumulatieve bedragen in R te berekenen