Comment supprimer les valeurs aberrantes d’un boxplot Seaborn
Lors de la création d’un boxplot dans Seaborn, vous pouvez utiliser l’argument showfliers=False pour supprimer les observations aberrantes du tracé :
sns.boxplot(x='variable', y='value', data=df, showfliers=False)
Si vous souhaitez simplement modifier la taille des marqueurs de valeurs aberrantes, vous pouvez utiliser l’argument fliersize :
sns.boxplot(x='variable', y='value', data=df, fliersize=3)
Notez que la taille par défaut de fliersize est 5 .
L’exemple suivant montre comment utiliser ces arguments dans la pratique.
Exemple : Supprimer les valeurs aberrantes du Seaborn Boxplot
Supposons que nous ayons le DataFrame pandas suivant qui montre les points marqués par les joueurs de trois équipes de basket-ball différentes :
import pandas as pd #create DataFrame df = pd.DataFrame({'A': [5, 7, 7, 9, 12, 78], 'B': [8, 8, 9, 13, 15, 17], 'C': [1, 2, 2, 4, 5, 60]}) #melt data frame into long format df_melted = pd.melt(df) #view head of DataFrame print(df_melted.head()) variable value 0 A 5 1 A 7 2 A 7 3 A 19 4 A 22
Nous pouvons utiliser la syntaxe suivante pour créer trois boxplots qui montrent la répartition des points marqués par chaque équipe :
import seaborn as sns
#create boxplot to visualize distribution of points by team
sns.boxplot(x='variable', y='value', data=df_melted)
Par défaut, seaborn utilise des marqueurs en forme de losange pour afficher les observations aberrantes.
Pour supprimer ces valeurs aberrantes du tracé, nous pouvons utiliser l’argument showfliers=False :
import seaborn as sns
#create boxplots and remove outliers
sns.boxplot(x='variable', y='value', data=df_melted, showfliers=False)
Notez que les valeurs aberrantes ont été entièrement supprimées du tracé.
Pour modifier simplement la taille du marqueur des valeurs aberrantes, nous pouvons utiliser l’argument fliersize :
import seaborn as sns
#create boxplots and adjust markers for outliers to be smaller
sns.boxplot(x='variable', y='value', data=df_melted, fliersize=3)
Notez que les tailles des marqueurs pour les valeurs aberrantes sont beaucoup plus petites.
N’hésitez pas à ajuster la valeur de la taille du flier pour rendre la taille du marqueur aussi petite ou grande que vous le souhaitez.
Remarque : Vous pouvez trouver la documentation complète de la fonction seaborn.boxplot() ici .
Ressources additionnelles
Les tutoriels suivants expliquent comment créer d’autres visualisations courantes dans seaborn :
Comment créer un diagramme circulaire dans Seaborn
Comment créer un graphique en aires dans Seaborn
Comment créer un tracé de série chronologique dans Seaborn