Como remover valores discrepantes de um boxplot seaborn


Ao criar um boxplot no Seaborn, você pode usar o argumento showfliers=False para remover valores discrepantes do gráfico:

 sns. boxplot (x=' variable ', y=' value ', data=df, showfliers= False )

Se você quiser apenas alterar o tamanho dos marcadores de outlier, poderá usar o argumento Fliersize :

 sns. boxplot (x=' variable ', y=' value ', data=df, fliersize= 3 )

Observe que o tamanho padrão do flyersize é 5 .

O exemplo a seguir mostra como usar esses argumentos na prática.

Exemplo: Remover valores discrepantes do Seaborn Boxplot

Suponha que temos o seguinte DataFrame do pandas que mostra os pontos marcados por jogadores em três times de basquete diferentes:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [5, 7, 7, 9, 12, 78],
                   ' B ': [8, 8, 9, 13, 15, 17],
                   ' C ': [1, 2, 2, 4, 5, 60]})

#melt data frame into long format
df_melted = pd. melt (df)

#view head of DataFrame
print ( df_melted.head ())

  variable value
0 to 5
1 to 7
2 to 7
3 to 19
4 to 22

Podemos usar a seguinte sintaxe para criar três boxplots que mostram a distribuição dos pontos marcados por cada equipe:

 import seaborn as sns

#create boxplot to visualize distribution of points by team
sns. boxplot (x=' variable ', y=' value ', data=df_melted) 

Por padrão, o Seaborn usa marcadores em forma de diamante para exibir valores discrepantes.

Para remover esses valores discrepantes do gráfico, podemos usar o argumento showfliers=False :

 import seaborn as sns

#create boxplots and remove outliers
sns. boxplot (x=' variable ', y=' value ', data=df_melted, showfliers= False ) 

Observe que os valores discrepantes foram completamente removidos do gráfico.

Para simplesmente alterar o tamanho do marcador de outlier, podemos usar o argumento Fliersize :

 import seaborn as sns

#create boxplots and adjust markers for outliers to be smaller
sns. boxplot (x=' variable ', y=' value ', data=df_melted, fliersize= 3 ) 

Observe que os tamanhos dos marcadores para valores discrepantes são muito menores.

Sinta-se à vontade para ajustar o valor do tamanho do folheto para tornar o tamanho do marcador tão pequeno ou grande quanto desejar.

Nota : Você pode encontrar a documentação completa da função seaborn.boxplot() aqui .

Recursos adicionais

Os tutoriais a seguir explicam como criar outras visualizações comuns em seaborn :

Como criar um gráfico de pizza no Seaborn
Como criar um gráfico de área no Seaborn
Como criar um gráfico de série temporal no Seaborn

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *