Comment identifier l’asymétrie dans les boîtes à moustaches



Une boîte à moustaches est un type de tracé qui affiche le résumé à cinq chiffres d’un ensemble de données, qui comprend :

  • La valeur minimale
  • Le premier quartile (le 25e percentile)
  • La valeur médiane
  • Le troisième quartile (le 75e percentile)
  • La valeur maximale

Nous utilisons le processus suivant pour dessiner une boîte à moustaches :

  • Dessinez une boîte du premier quartile (Q1) au troisième quartile (Q3)
  • Tracez ensuite une ligne à l’intérieur de la boîte au niveau de la médiane
  • Dessinez ensuite des « moustaches » des quartiles jusqu’aux valeurs minimales et maximales.

Nous pouvons déterminer si une distribution est asymétrique ou non en fonction de l’emplacement de la valeur médiane dans la boîte à moustaches.

Asymétrie du box plot

Lorsque la médiane est plus proche du bas de la boîte et que la moustache est plus courte à l’extrémité inférieure de la boîte, la distribution est asymétrique à droite (ou asymétrique « positivement »).

Lorsque la médiane est plus proche du haut de la boîte et que la moustache est plus courte à l’extrémité supérieure de la boîte, la distribution est asymétrique à gauche (ou asymétrique « négativement »).

Lorsque la médiane est au milieu de la boîte et que les moustaches sont à peu près égales de chaque côté, la répartition est symétrique (ou « non » asymétrique).

Les exemples suivants illustrent comment utiliser les boîtes à moustaches pour déterminer si une distribution est asymétrique à droite, à gauche ou n’a pas d’asymétrie.

Exemple 1 : distribution asymétrique à droite

La répartition des revenus annuels des ménages aux États-Unis est asymétrique à droite. La plupart des ménages gagnent entre 40 000 et 80 000 $ par an, mais il existe une longue queue droite sur la distribution qui représente les ménages qui gagnent beaucoup plus.

Si nous créions un diagramme en boîte pour visualiser la répartition des revenus des ménages, cela ressemblerait à ceci :

Notez que la ligne verticale à l’intérieur de la case qui représente la médiane est beaucoup plus proche du premier quartile que du troisième quartile, ce qui signifie que la distribution est asymétrique vers la droite.

Exemple 2 : distribution asymétrique à gauche

La répartition de l’âge des décès dans la plupart des populations est asymétrique à gauche. La plupart des gens vivent entre 70 et 80 ans, et de moins en moins vivent en dessous de cet âge.

Si nous créions un diagramme en boîte pour visualiser la distribution de l’âge des décès, cela ressemblerait à ceci :

Notez que la ligne verticale à l’intérieur de la case qui représente la médiane est beaucoup plus proche du troisième quartile que du premier quartile, ce qui signifie que la distribution est asymétrique à gauche.

Exemple 3 : distribution symétrique

La répartition de la taille des mâles est à peu près symétrique et ne présente aucune asymétrie. Par exemple, la taille moyenne d’un homme aux États-Unis est d’environ 69,1 pouces. La répartition des hauteurs est à peu près symétrique, certaines étant plus courtes et d’autres plus hautes.

Si nous créions un diagramme en boîte pour visualiser la répartition de la taille des hommes aux États-Unis, cela ressemblerait à ceci :

Notez que la ligne verticale à l’intérieur de la case qui représente la médiane est également proche du premier quartile et du troisième quartile, ce qui signifie que la distribution est symétrique et sans asymétrie.

Ressources additionnelles

Distributions asymétriques à gauche ou à droite
Comment comparer les boîtes à moustaches : avec des exemples
Comment créer des boîtes à moustaches côte à côte dans Excel

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *