Comment supprimer les valeurs aberrantes d’un boxplot Seaborn



Lors de la création d’un boxplot dans Seaborn, vous pouvez utiliser l’argument showfliers=False pour supprimer les observations aberrantes du tracé :

sns.boxplot(x='variable', y='value', data=df, showfliers=False)

Si vous souhaitez simplement modifier la taille des marqueurs de valeurs aberrantes, vous pouvez utiliser l’argument fliersize :

sns.boxplot(x='variable', y='value', data=df, fliersize=3)

Notez que la taille par défaut de fliersize est 5 .

L’exemple suivant montre comment utiliser ces arguments dans la pratique.

Exemple : Supprimer les valeurs aberrantes du Seaborn Boxplot

Supposons que nous ayons le DataFrame pandas suivant qui montre les points marqués par les joueurs de trois équipes de basket-ball différentes :

import pandas as pd

#create DataFrame
df = pd.DataFrame({'A': [5, 7, 7, 9, 12, 78],
                   'B': [8, 8, 9, 13, 15, 17],
                   'C': [1, 2, 2, 4, 5, 60]})

#melt data frame into long format
df_melted = pd.melt(df)

#view head of DataFrame
print(df_melted.head())

  variable  value
0        A      5
1        A      7
2        A      7
3        A     19
4        A     22

Nous pouvons utiliser la syntaxe suivante pour créer trois boxplots qui montrent la répartition des points marqués par chaque équipe :

import seaborn as sns

#create boxplot to visualize distribution of points by team
sns.boxplot(x='variable', y='value', data=df_melted)

Par défaut, seaborn utilise des marqueurs en forme de losange pour afficher les observations aberrantes.

Pour supprimer ces valeurs aberrantes du tracé, nous pouvons utiliser l’argument showfliers=False :

import seaborn as sns

#create boxplots and remove outliers
sns.boxplot(x='variable', y='value', data=df_melted, showfliers=False)

Notez que les valeurs aberrantes ont été entièrement supprimées du tracé.

Pour modifier simplement la taille du marqueur des valeurs aberrantes, nous pouvons utiliser l’argument fliersize :

import seaborn as sns

#create boxplots and adjust markers for outliers to be smaller
sns.boxplot(x='variable', y='value', data=df_melted, fliersize=3)

Notez que les tailles des marqueurs pour les valeurs aberrantes sont beaucoup plus petites.

N’hésitez pas à ajuster la valeur de la taille du flier pour rendre la taille du marqueur aussi petite ou grande que vous le souhaitez.

Remarque : Vous pouvez trouver la documentation complète de la fonction seaborn.boxplot() ici .

Ressources additionnelles

Les tutoriels suivants expliquent comment créer d’autres visualisations courantes dans seaborn :

Comment créer un diagramme circulaire dans Seaborn
Comment créer un graphique en aires dans Seaborn
Comment créer un tracé de série chronologique dans Seaborn

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *