Comment commander des boxplots sur l’axe des x dans Seaborn



Vous pouvez utiliser les méthodes suivantes pour modifier l’ordre des boîtes à moustaches le long de l’axe des x dans Seaborn :

Méthode 1 : trier les boîtes à moustaches à l’aide d’un ordre personnalisé

sns.boxplot(x='group_var', y='values_var', data=df, order=['A', 'B', 'C'])

Méthode 2 : trier les boîtes à moustaches à l’aide d’une métrique

group_means=df.groupby(['group_var'])['values_var'].mean().sort_values(ascending=True)

sns.boxplot(x='group_var', y='values_var', data=df, order=group_means.index)

Les exemples suivants montrent comment utiliser chaque méthode dans la pratique avec le DataFrame pandas suivant qui montre les points marqués par les basketteurs de trois équipes différentes :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'team': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B',
                            'B', 'B', 'C', 'C', 'C', 'C', 'C'],
                   'points': [3, 4, 6, 8, 9, 10, 13, 16, 18, 20, 8, 9, 12, 13, 15]})

#view head of DataFrame
print(df.head())

  team  points
0    A       3
1    A       4
2    A       6
3    A       8
4    A       9

Exemple 1 : Commander des boîtes à moustaches à l’aide d’un ordre personnalisé

Le code suivant montre comment créer un boxplot pour visualiser la répartition des points pour chaque équipe et classer les boxplots dans l’ordre suivant en fonction du nom de l’équipe : C, A, B.

import seaborn as sns

#create boxplots with custom order
sns.boxplot(x='team', y='points', data=df, order=['C', 'A', 'B'])

Notez que les boîtes à moustaches sont ordonnées le long de l’axe des x dans l’ordre exact que nous avons spécifié.

Exemple 2 : Ordonner des boîtes à moustaches à l’aide d’une métrique

Le code suivant montre comment créer un boxplot pour visualiser la répartition des points pour chaque équipe et classer les boxplots par ordre croissant en fonction de la moyenne des points marqués par équipe :

import seaborn as sns

#calculate mean points by team
mean_by_team = df.groupby(['team'])['points'].mean().sort_values(ascending=True)

#create boxplots ordered by mean points (ascending)
sns.boxplot(x='team', y='points', data=df, order=mean_by_team.index)

Notez que les boîtes à moustaches sont classées le long de l’axe des X en fonction de la valeur moyenne des points par équipe par ordre croissant.

Pour afficher les boxplots par ordre décroissant, spécifiez simplement ascending=False dans la fonction sort_values() :

import seaborn as sns

#calculate mean points by team
mean_by_team = df.groupby(['team'])['points'].mean().sort_values(ascending=False)

#create boxplots ordered by mean points (descending)
sns.boxplot(x='team', y='points', data=df, order=mean_by_team.index)

Les boxplots sont désormais classés le long de l’axe des x en fonction de la valeur moyenne des points par équipe par ordre décroissant.

Remarque : Pour trier les boîtes à moustaches en fonction d’une métrique différente (par exemple la médiane), spécifiez simplement cette métrique après la fonction groupby() dans le code ci-dessus.

Ressources additionnelles

Les didacticiels suivants expliquent comment exécuter d’autres fonctions courantes dans seaborn :

Comment supprimer les valeurs aberrantes d’un boxplot Seaborn
Comment créer un boxplot de plusieurs colonnes dans Seaborn

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *