Seaborn 상자 그림에서 이상값을 제거하는 방법


Seaborn에서 상자 그림을 만들 때 showfliers=False 인수를 사용하여 그림에서 이상값을 제거할 수 있습니다.

 sns. boxplot (x=' variable ', y=' value ', data=df, showfliers= False )

이상값 마커의 크기만 변경하려면 fliersize 인수를 사용할 수 있습니다.

 sns. boxplot (x=' variable ', y=' value ', data=df, fliersize= 3 )

fliersize 의 기본 크기는 5 입니다.

다음 예에서는 실제로 이러한 인수를 사용하는 방법을 보여줍니다.

예: Seaborn 상자 그림에서 이상값 제거

세 개의 서로 다른 농구 팀의 선수들이 득점한 점수를 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A ': [5, 7, 7, 9, 12, 78],
                   ' B ': [8, 8, 9, 13, 15, 17],
                   ' C ': [1, 2, 2, 4, 5, 60]})

#melt data frame into long format
df_melted = pd. melt (df)

#view head of DataFrame
print ( df_melted.head ())

  variable value
0 to 5
1 to 7
2 to 7
3 to 19
4 to 22

다음 구문을 사용하여 각 팀이 득점한 점수 분포를 보여주는 세 개의 상자 그림을 만들 수 있습니다.

 import seaborn as sns

#create boxplot to visualize distribution of points by team
sns. boxplot (x=' variable ', y=' value ', data=df_melted) 

기본적으로 seaborn은 다이아몬드 모양의 마커를 사용하여 이상값을 표시합니다.

플롯에서 이러한 이상값을 제거하려면 showfliers=False 인수를 사용할 수 있습니다.

 import seaborn as sns

#create boxplots and remove outliers
sns. boxplot (x=' variable ', y=' value ', data=df_melted, showfliers= False ) 

이상치가 플롯에서 완전히 제거되었습니다.

이상값 마커의 크기를 간단히 변경하려면 fliersize 인수를 사용할 수 있습니다.

 import seaborn as sns

#create boxplots and adjust markers for outliers to be smaller
sns. boxplot (x=' variable ', y=' value ', data=df_melted, fliersize= 3 ) 

특이치에 대한 마커 크기는 훨씬 작습니다.

전단지 크기 값을 자유롭게 조정하여 마커 크기를 원하는 대로 작거나 크게 만들 수 있습니다.

참고 : 여기에서 seaborn.boxplot() 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 seaborn 에서 다른 일반적인 시각화를 만드는 방법을 설명합니다.

Seaborn에서 원형 차트를 만드는 방법
Seaborn에서 면적 차트를 만드는 방법
Seaborn에서 시계열 도표를 만드는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다