Quand devriez-vous utiliser une boîte à moustaches ? (3 scénarios)



Une boîte à moustaches est un type de tracé qui affiche le résumé à cinq chiffres d’un ensemble de données, qui comprend :

  • La valeur minimale
  • Le premier quartile (le 25e centile)
  • La valeur médiane
  • Le troisième quartile (le 75e percentile)
  • La valeur maximale

Nous utilisons trois étapes simples pour créer une boîte à moustaches pour n’importe quel ensemble de données :

  • 1. Dessinez une boîte du premier au troisième quartile
  • 2. Tracez une ligne verticale à la médiane
  • 3. Dessinez des « moustaches » des quartiles jusqu’à la valeur minimale et maximale

Nous créons généralement des boîtes à moustaches dans l’un des trois scénarios suivants :

Scénario 1 : Visualiser la distribution des valeurs dans un ensemble de données.

Une boîte à moustaches nous permet de visualiser rapidement la distribution des valeurs dans un ensemble de données et de voir où se trouvent les cinq valeurs récapitulatives numériques.

Scénario 2 : Pour comparer deux ou plusieurs distributions.

Les boîtes à moustaches côte à côte nous permettent de visualiser les différences entre deux ou plusieurs distributions et de comparer les valeurs médianes et la répartition des valeurs entre les distributions.

Scénario 3 : Pour identifier les valeurs aberrantes.

Dans les diagrammes en boîte, les valeurs aberrantes sont généralement représentées par de minuscules cercles qui s’étendent au-delà de chaque moustache. Une observation est définie comme étant aberrante si elle répond à l’un des critères suivants :

  • Une observation est inférieure à Q1 – 1,5*(Ecart interquartile)
  • Une observation est supérieure à Q3 + 1,5*(Ecart interquartile)

En créant un diagramme en boîte, nous pouvons rapidement voir si une distribution présente ou non des valeurs aberrantes.

Les exemples suivants montrent comment nous utiliserions une boîte à moustaches dans chaque scénario.

Scénario 1 : Visualiser la distribution des valeurs dans un ensemble de données

Supposons qu’un entraîneur de basket-ball souhaite visualiser la répartition des points marqués par les joueurs de son équipe et crée donc le diagramme en boîte suivant :

Sur la base de ce box plot, il peut rapidement voir les valeurs suivantes :

  • Minimum : 5
  • T1 (premier quartile) : environ 8
  • Médiane : environ 13
  • T3 (troisième quartile) : environ 18
  • Maximum : 25

Cela permet à l’entraîneur de voir rapidement que les points marqués par les joueurs varient de 5 à 25, que la médiane des points marqués est d’environ 13 et que 50 % de ses joueurs marquent entre 8 et 18 points environ par match.

Scénario 2 : comparer deux distributions ou plus

Supposons qu’un analyste sportif veuille comparer la répartition des points marqués par les basketteurs de trois équipes différentes et crée les diagrammes en boîte suivants :

À l’aide de ces graphiques, il peut rapidement voir que l’équipe C a les points médians marqués les plus élevés et que l’équipe A a les points médians marqués les plus bas.

Il peut également rapidement constater que l’équipe B a la plus grande répartition de points marqués puisque le diagramme en boîte de l’équipe B a la boîte la plus longue.

Scénario 3 : Identifier les valeurs aberrantes

Supposons qu’un entraîneur de basket-ball veuille savoir si l’un de ses joueurs est aberrant en termes de points marqués. Il décide de créer le box plot suivant pour visualiser la répartition des points marqués par ses joueurs :

À l’aide de ce tracé, le coach peut voir que le petit point en haut du tracé indique une valeur aberrante.

Plus précisément, l’un des joueurs a marqué environ 50 points, ce qui est considéré comme une valeur aberrante par rapport à tous les autres points marqués.

Ressources additionnelles

Les didacticiels suivants offrent des explications détaillées sur la façon d’utiliser les boîtes à moustaches dans la pratique :

Comment trouver l’intervalle interquartile (IQR) d’une boîte à moustaches
Comment identifier l’asymétrie dans les diagrammes en boîte
Comment comparer les boîtes à moustaches

Les didacticiels suivants expliquent comment créer des diagrammes en boîte dans différents logiciels statistiques :

Comment créer un diagramme en boîte dans Google Sheets
Comment créer des boîtes à moustaches dans SPSS
Comment créer des diagrammes en boîtes côte à côte dans Excel
Comment créer des diagrammes en boîtes côte à côte dans R

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *