Personnaliser les préférences

Nous utilisons des cookies pour vous aider à naviguer efficacement et à exécuter certaines fonctions. Vous trouverez ci-dessous des informations détaillées sur tous les cookies sous chaque catégorie de consentement.

Les cookies classés comme « Nécessaires » sont stockés sur votre navigateur car ils sont essentiels pour activer les fonctionnalités de base du site.... 

Toujours actif

Necessary cookies are required to enable the basic features of this site, such as providing secure log-in or adjusting your consent preferences. These cookies do not store any personally identifiable data.

Aucun cookie à afficher.

Functional cookies help perform certain functionalities like sharing the content of the website on social media platforms, collecting feedback, and other third-party features.

Aucun cookie à afficher.

Analytical cookies are used to understand how visitors interact with the website. These cookies help provide information on metrics such as the number of visitors, bounce rate, traffic source, etc.

Aucun cookie à afficher.

Performance cookies are used to understand and analyze the key performance indexes of the website which helps in delivering a better user experience for the visitors.

Aucun cookie à afficher.

Advertisement cookies are used to provide visitors with customized advertisements based on the pages you visited previously and to analyze the effectiveness of the ad campaigns.

Aucun cookie à afficher.

Comment créer un graphique de Pareto dans R (étape par étape)



Un graphique de Pareto est un type de graphique qui affiche les fréquences de différentes catégories ainsi que les fréquences cumulées des catégories.

Diagramme de Pareto en R

Ce didacticiel fournit un exemple étape par étape de la création d’un diagramme de Pareto dans R.

Étape 1 : Créer les données

Supposons que nous menions une enquête dans laquelle nous demandons à 350 personnes différentes d’identifier leur marque de céréales préférée entre les marques A, B, C, D et E.

L’ensemble de données suivant montre le total des votes pour chaque marque :

#create data
df <- data.frame(favorite=c('A', 'B', 'C', 'D', 'E', 'F'),
                 count=c(140, 97, 58, 32, 17, 6))

#view data
df

  favorite count
1        A   140
2        B    97
3        C    58
4        D    32
5        E    17
6        F     6

Étape 2 : Créer le graphique de Pareto

Pour créer un diagramme de Pareto afin de visualiser les résultats de cette enquête, nous pouvons utiliser la fonction pareto.chart() du package qcc :

library(qcc)

#create Pareto chart
pareto.chart(df$count)

Pareto chart analysis for df$count
     Frequency  Cum.Freq. Percentage Cum.Percent.
  A 140.000000 140.000000  40.000000    40.000000
  B  97.000000 237.000000  27.714286    67.714286
  C  58.000000 295.000000  16.571429    84.285714
  D  32.000000 327.000000   9.142857    93.428571
  E  17.000000 344.000000   4.857143    98.285714
  F   6.000000 350.000000   1.714286   100.000000

Le tableau en sortie nous montre la fréquence et la fréquence cumulée de chaque marque. Par exemple:

  • Fréquence de la marque A : 140 | Fréquence cumulée : 140
  • Fréquence de la marque B : 97 | Fréquence cumulée de A, B : 237
  • Fréquence de la marque C : 58 | Fréquence cumulée de A, B, C : 295

Et ainsi de suite.

Étape 3 : modifier le graphique de Pareto (facultatif)

Le code suivant montre comment modifier le titre du graphique ainsi que la palette de couleurs utilisée :

pareto.chart(df$count,
             main='Pareto Chart for Favorite Cereal Brands',
             col=heat.colors(length(df$count)))

Diagramme de Pareto en R

Vous pouvez trouver une liste complète des palettes de couleurs disponibles dans cette aide-mémoire R Color .

Ressources additionnelles

Comment créer des tableaux de fréquences dans R
Comment créer un histogramme de fréquence relative dans R
Comment calculer les sommes cumulées dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *