Comment créer un graphique de Pareto dans R (étape par étape)



Un graphique de Pareto est un type de graphique qui affiche les fréquences de différentes catégories ainsi que les fréquences cumulées des catégories.

Diagramme de Pareto en R

Ce didacticiel fournit un exemple étape par étape de la création d’un diagramme de Pareto dans R.

Étape 1 : Créer les données

Supposons que nous menions une enquête dans laquelle nous demandons à 350 personnes différentes d’identifier leur marque de céréales préférée entre les marques A, B, C, D et E.

L’ensemble de données suivant montre le total des votes pour chaque marque :

#create data
df <- data.frame(favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
                 count=c(140, 97, 58, 32, 17, 6))

#view data
df

  favorite count
1        A   140
2        B    97
3        C    58
4        D    32
5        E    17
6        F     6

Étape 2 : Créer le graphique de Pareto

Pour créer un diagramme de Pareto afin de visualiser les résultats de cette enquête, nous pouvons utiliser la fonction pareto.chart() du package qcc :

library(qcc)

#create Pareto chart
pareto.chart(df$count)

Pareto chart analysis for df$count
     Frequency  Cum.Freq. Percentage Cum.Percent.
  A 140.000000 140.000000  40.000000    40.000000
  B  97.000000 237.000000  27.714286    67.714286
  C  58.000000 295.000000  16.571429    84.285714
  D  32.000000 327.000000   9.142857    93.428571
  E  17.000000 344.000000   4.857143    98.285714
  F   6.000000 350.000000   1.714286   100.000000

Le tableau en sortie nous montre la fréquence et la fréquence cumulée de chaque marque. Par exemple:

  • Fréquence de la marque A : 140 | Fréquence cumulée : 140
  • Fréquence de la marque B : 97 | Fréquence cumulée de A, B : 237
  • Fréquence de la marque C : 58 | Fréquence cumulée de A, B, C : 295

Et ainsi de suite.

Étape 3 : modifier le graphique de Pareto (facultatif)

Le code suivant montre comment modifier le titre du graphique ainsi que la palette de couleurs utilisée :

pareto.chart(df$count,
             main='Pareto Chart for Favorite Cereal Brands',
             col=heat.colors(length(df$count)))

Diagramme de Pareto en R

Vous pouvez trouver une liste complète des palettes de couleurs disponibles dans cette aide-mémoire R Color .

Ressources additionnelles

Comment créer des tableaux de fréquences dans R
Comment créer un histogramme de fréquence relative dans R
Comment calculer les sommes cumulées dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *