Come rimuovere i valori anomali da un boxplot seaborn


Quando crei un boxplot in Seaborn, puoi utilizzare l’argomento showfliers=False per rimuovere i valori anomali dalla trama:

 sns. boxplot (x=' variable ', y=' value ', data=df, showfliers= False )

Se vuoi solo modificare la dimensione degli indicatori anomali, puoi utilizzare l’argomento fliersize :

 sns. boxplot (x=' variable ', y=' value ', data=df, fliersize= 3 )

Tieni presente che la dimensione predefinita di flyersize è 5 .

L’esempio seguente mostra come utilizzare questi argomenti nella pratica.

Esempio: rimuovere i valori anomali dal boxplot Seaborn

Supponiamo di avere il seguente DataFrame panda che mostra i punti segnati dai giocatori di tre diverse squadre di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [5, 7, 7, 9, 12, 78],
                   ' B ': [8, 8, 9, 13, 15, 17],
                   ' C ': [1, 2, 2, 4, 5, 60]})

#melt data frame into long format
df_melted = pd. melt (df)

#view head of DataFrame
print ( df_melted.head ())

  variable value
0 to 5
1 to 7
2 to 7
3 to 19
4 to 22

Possiamo utilizzare la seguente sintassi per creare tre boxplot che mostrano la distribuzione dei punti segnati da ciascuna squadra:

 import seaborn as sns

#create boxplot to visualize distribution of points by team
sns. boxplot (x=' variable ', y=' value ', data=df_melted) 

Per impostazione predefinita, Seaborn utilizza indicatori a forma di diamante per visualizzare i valori anomali.

Per rimuovere questi valori anomali dalla trama, possiamo utilizzare l’argomento showfliers=False :

 import seaborn as sns

#create boxplots and remove outliers
sns. boxplot (x=' variable ', y=' value ', data=df_melted, showfliers= False ) 

Si noti che i valori anomali sono stati completamente rimossi dal grafico.

Per modificare semplicemente la dimensione del marcatore anomalo, possiamo utilizzare l’argomento fliersize :

 import seaborn as sns

#create boxplots and adjust markers for outliers to be smaller
sns. boxplot (x=' variable ', y=' value ', data=df_melted, fliersize= 3 ) 

Tieni presente che le dimensioni dei marcatori per i valori anomali sono molto più piccole.

Sentiti libero di regolare il valore della dimensione del volantino per rendere la dimensione del pennarello piccola o grande come desideri.

Nota : puoi trovare la documentazione completa per la funzione seaborn.boxplot() qui .

Risorse addizionali

I seguenti tutorial spiegano come creare altre visualizzazioni comuni in Seaborn :

Come creare un grafico a torta in Seaborn
Come creare un grafico ad area in Seaborn
Come creare un grafico di serie temporali in Seaborn

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *