Comment créer un graphique de Pareto dans R (étape par étape)
Un graphique de Pareto est un type de graphique qui affiche les fréquences de différentes catégories ainsi que les fréquences cumulées des catégories.
Ce didacticiel fournit un exemple étape par étape de la création d’un diagramme de Pareto dans R.
Étape 1 : Créer les données
Supposons que nous menions une enquête dans laquelle nous demandons à 350 personnes différentes d’identifier leur marque de céréales préférée entre les marques A, B, C, D et E.
L’ensemble de données suivant montre le total des votes pour chaque marque :
#create data df <- data.frame(favorite=c('A', 'B', 'C', 'D', 'E', 'F'), count=c(140, 97, 58, 32, 17, 6)) #view data df favorite count 1 A 140 2 B 97 3 C 58 4 D 32 5 E 17 6 F 6
Étape 2 : Créer le graphique de Pareto
Pour créer un diagramme de Pareto afin de visualiser les résultats de cette enquête, nous pouvons utiliser la fonction pareto.chart() du package qcc :
library(qcc) #create Pareto chart pareto.chart(df$count) Pareto chart analysis for df$count Frequency Cum.Freq. Percentage Cum.Percent. A 140.000000 140.000000 40.000000 40.000000 B 97.000000 237.000000 27.714286 67.714286 C 58.000000 295.000000 16.571429 84.285714 D 32.000000 327.000000 9.142857 93.428571 E 17.000000 344.000000 4.857143 98.285714 F 6.000000 350.000000 1.714286 100.000000
Le tableau en sortie nous montre la fréquence et la fréquence cumulée de chaque marque. Par exemple:
- Fréquence de la marque A : 140 | Fréquence cumulée : 140
- Fréquence de la marque B : 97 | Fréquence cumulée de A, B : 237
- Fréquence de la marque C : 58 | Fréquence cumulée de A, B, C : 295
Et ainsi de suite.
Étape 3 : modifier le graphique de Pareto (facultatif)
Le code suivant montre comment modifier le titre du graphique ainsi que la palette de couleurs utilisée :
pareto.chart(df$count, main='Pareto Chart for Favorite Cereal Brands', col=heat.colors(length(df$count)))
Vous pouvez trouver une liste complète des palettes de couleurs disponibles dans cette aide-mémoire R Color .
Ressources additionnelles
Comment créer des tableaux de fréquences dans R
Comment créer un histogramme de fréquence relative dans R
Comment calculer les sommes cumulées dans R