Come creare un grafico di pareto in r (passo dopo passo)
Un grafico di Pareto è un tipo di grafico che mostra le frequenze di diverse categorie nonché le frequenze cumulative delle categorie.
Questo tutorial fornisce un esempio passo passo della creazione di un grafico di Pareto in R.
Passaggio 1: creare i dati
Supponiamo di condurre un sondaggio in cui chiediamo a 350 persone diverse di identificare la loro marca di cereali preferita tra le marche A, B, C, D ed E.
Il seguente set di dati mostra i voti totali per ciascun marchio:
#createdata df <- data. frame (favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #viewdata df favorite count 1 to 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Passaggio 2: crea il grafico di Pareto
Per creare un diagramma di Pareto per visualizzare i risultati di questo sondaggio, possiamo utilizzare la funzione pareto.chart() del pacchetto qcc :
library (qcc) #create Pareto chart pareto. chart (df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
La tabella di output ci mostra la frequenza e la frequenza cumulativa di ciascun marchio. Per esempio:
- Frequenza marca A: 140 | Frequenza cumulativa: 140
- Frequenza marca B: 97 | Frequenza cumulativa di A, B: 237
- Frequenza del segno C: 58 | Frequenza cumulativa di A, B, C: 295
E così via.
Passaggio 3: modifica il grafico di Pareto (facoltativo)
Il codice seguente mostra come modificare il titolo del grafico e la tavolozza dei colori utilizzata:
pareto. chart (df$count, main=' Pareto Chart for Favorite Cereal Brands ', col=heat. colors ( length (df$count)))
Puoi trovare un elenco completo delle tavolozze di colori disponibili in questo cheat sheet di R Color .
Risorse addizionali
Come creare tabelle di frequenza in R
Come creare un istogramma di frequenza relativo in R
Come calcolare le somme cumulative in R