Comment créer un graphique à bandes dans R



Un graphique à bandes est un type de graphique qui affiche des données numériques le long d’une seule bande. Semblables aux boîtes à moustaches , les graphiques en bandes peuvent vous aider à visualiser la distribution des données. Les graphiques en bandes peuvent constituer une bonne alternative aux boîtes à moustaches lorsque la taille des échantillons est petite, afin que vous puissiez voir les points de données individuels.

Ce didacticiel explique comment créer un graphique à bandes dans R à l’aide de la fonction stripchart() intégrée.

La fonction stripchart()

La syntaxe de base pour créer un graphique en bandes dans R est la suivante :

stripchart(x, méthode, gigue, main, xlab, ylab, col, pch, vertical, group.names)

  • x : un vecteur numérique ou une liste de vecteurs numériques à tracer. C’est le seul argument requis pour produire une intrigue.
  • méthode : la méthode à utiliser pour séparer les points qui ont des valeurs identiques. La méthode par défaut « overplot » provoque le surtraçage de ces points, mais il est possible de spécifier « jitter » pour faire trembler les points ou « stack » pour empiler les points.
  • jitter : lorsque method = « jitter » est utilisé, cela fournit la quantité de jittering à appliquer.
  • principal : titre du graphique
  • xlab : étiquette de l’axe des x
  • ylab : étiquette de l’axe y
  • col : couleur des points du tracé
  • pch : forme des points du tracé
  • vertical : lorsque vertical est « TRUE », le tracé est dessiné verticalement plutôt que horizontalement par défaut
  • group.names : étiquettes de groupe à imprimer à côté du tracé, si plusieurs vecteurs numériques sont tracés.

Graphique en bandes pour un seul vecteur numérique

L’exemple suivant utilise l’ iris de l’ensemble de données R intégré pour créer un graphique en bandes pour un seul vecteur numérique.

#view first six rows of iris dataset
head(iris)

#  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1          5.1         3.5          1.4         0.2  setosa
#2          4.9         3.0          1.4         0.2  setosa
#3          4.7         3.2          1.3         0.2  setosa
#4          4.6         3.1          1.5         0.2  setosa
#5          5.0         3.6          1.4         0.2  setosa
#6          5.4         3.9          1.7         0.4  setosa

Le code suivant crée un graphique en bandes de base pour la variable Sepal.Length :

stripchart(iris$Sepal.Length)

Nous pouvons également ajouter des arguments supplémentaires pour ajouter un titre et une étiquette sur l’axe des x, changer la couleur des points, changer la forme des points et utiliser la méthode « jitter » afin que les points individuels ne se chevauchent pas :

stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Au lieu de mélanger les points, nous pouvons les « empiler » :

stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'stack')

Nous pouvons également afficher le tracé verticalement au lieu de l’horizontale par défaut et modifier l’étiquette de l’axe pour qu’elle soit sur l’axe y :

stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           ylab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter',
           vertical = TRUE)

Graphique en bandes pour plusieurs vecteurs numériques

Nous pouvons également dessiner plusieurs graphiques en bandes dans un seul tracé en transmettant une liste de vecteurs numériques.

Le code suivant crée une liste contenant les variables Longueur et Largeur des sépales dans l’ensemble de données de l’iris et produit un graphique en bandes pour chaque variable dans un seul tracé :

#create list of variables
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)

#create plot that contains one strip chart per variable
stripchart(x,
           main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Tout comme dans l’exemple précédent, nous pouvons choisir de tracer les graphiques en bandes verticalement au lieu de l’horizontale par défaut :

stripchart(x, main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

De plus, nous pouvons passer une formule sous la forme y~x dans la fonction stripchart(), où y est un vecteur numérique regroupé par la valeur de x .

Par exemple, dans l’ensemble de données sur l’iris , nous pourrions regrouper les données selon l’espèce qui a trois valeurs distinctes (« setosa », « versicolor » et « virginica »), puis tracer la longueur des sépales pour chaque espèce dans un graphique en bandes :

stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

Pour afficher la documentation complète sur la fonction stripchart() dans R, tapez simplement :

?stripchart

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *