Cara menghilangkan outlier dari plot kotak seaborn


Saat membuat plot kotak di Seaborn, Anda dapat menggunakan argumen showfliers=False untuk menghapus outlier dari plot:

 sns. boxplot (x=' variable ', y=' value ', data=df, showfliers= False )

Jika Anda hanya ingin mengubah ukuran penanda outlier, Anda dapat menggunakan argumen fliersize :

 sns. boxplot (x=' variable ', y=' value ', data=df, fliersize= 3 )

Perhatikan bahwa ukuran default flyersize adalah 5 .

Contoh berikut menunjukkan cara menggunakan argumen ini dalam praktik.

Contoh: Hapus outlier dari Seaborn Boxplot

Misalkan kita memiliki DataFrame panda berikut yang menunjukkan poin yang dicetak oleh pemain di tiga tim bola basket berbeda:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [5, 7, 7, 9, 12, 78],
                   ' B ': [8, 8, 9, 13, 15, 17],
                   ' C ': [1, 2, 2, 4, 5, 60]})

#melt data frame into long format
df_melted = pd. melt (df)

#view head of DataFrame
print ( df_melted.head ())

  variable value
0 to 5
1 to 7
2 to 7
3 to 19
4 to 22

Kita dapat menggunakan sintaks berikut untuk membuat tiga diagram kotak yang menunjukkan distribusi poin yang dicetak oleh masing-masing tim:

 import seaborn as sns

#create boxplot to visualize distribution of points by team
sns. boxplot (x=' variable ', y=' value ', data=df_melted) 

Secara default, seaborn menggunakan penanda berbentuk berlian untuk menampilkan outlier.

Untuk menghilangkan outlier ini dari plot, kita dapat menggunakan argumen showfliers=False :

 import seaborn as sns

#create boxplots and remove outliers
sns. boxplot (x=' variable ', y=' value ', data=df_melted, showfliers= False ) 

Perhatikan bahwa outlier telah dihapus seluruhnya dari plot.

Untuk sekadar mengubah ukuran penanda outlier, kita dapat menggunakan argumen fliersize :

 import seaborn as sns

#create boxplots and adjust markers for outliers to be smaller
sns. boxplot (x=' variable ', y=' value ', data=df_melted, fliersize= 3 ) 

Perhatikan bahwa ukuran penanda untuk outlier jauh lebih kecil.

Jangan ragu untuk menyesuaikan nilai ukuran pamflet untuk membuat ukuran penanda menjadi kecil atau besar sesuai keinginan Anda.

Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi seaborn.boxplot() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara membuat visualisasi umum lainnya di seaborn :

Cara Membuat Diagram Lingkaran di Seaborn
Cara Membuat Bagan Area di Seaborn
Cara Membuat Plot Deret Waktu di Seaborn

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *