Seaborn 箱ひげ図から外れ値を削除する方法


Seaborn で箱ひげ図を作成する場合、 showfliers=False引数を使用してプロットから外れ値を削除できます。

 sns. boxplot (x=' variable ', y=' value ', data=df, showfliers= False )

外れ値マーカーのサイズを変更したいだけの場合は、 fliersize引数を使用できます。

 sns. boxplot (x=' variable ', y=' value ', data=df, fliersize= 3 )

fliersizeのデフォルトのサイズは5であることに注意してください。

次の例は、これらの引数を実際に使用する方法を示しています。

例: Seaborn 箱ひげ図から外れ値を削除する

3 つの異なるバスケットボール チームの選手が獲得したポイントを示す次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [5, 7, 7, 9, 12, 78],
                   ' B ': [8, 8, 9, 13, 15, 17],
                   ' C ': [1, 2, 2, 4, 5, 60]})

#melt data frame into long format
df_melted = pd. melt (df)

#view head of DataFrame
print ( df_melted.head ())

  variable value
0 to 5
1 to 7
2 to 7
3 to 19
4 to 22

次の構文を使用して、各チームが獲得したポイントの分布を示す 3 つの箱ひげ図を作成できます。

 import seaborn as sns

#create boxplot to visualize distribution of points by team
sns. boxplot (x=' variable ', y=' value ', data=df_melted) 

デフォルトでは、seaborn はひし形のマーカーを使用して異常値を表示します。

これらの異常値をプロットから削除するには、 showflyers=False引数を使用します。

 import seaborn as sns

#create boxplots and remove outliers
sns. boxplot (x=' variable ', y=' value ', data=df_melted, showfliers= False ) 

外れ値がプロットから完全に削除されていることに注意してください。

外れ値マーカーのサイズを単純に変更するには、 fliersize引数を使用できます。

 import seaborn as sns

#create boxplots and adjust markers for outliers to be smaller
sns. boxplot (x=' variable ', y=' value ', data=df_melted, fliersize= 3 ) 

外れ値のマーカー サイズははるかに小さいことに注意してください。

チラシサイズの値を自由に調整して、マーカー サイズを必要に応じて小さくしたり大きくしたりできます。

: seaborn.boxplot()関数の完全なドキュメントは ここで見つけることができます。

追加リソース

次のチュートリアルでは、 seabornで他の一般的なビジュアライゼーションを作成する方法を説明します。

Seaborn で円グラフを作成する方法
Seaborn で面グラフを作成する方法
Seaborn で時系列プロットを作成する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です