Seaborn 상자 그림에서 이상값을 제거하는 방법
Seaborn에서 상자 그림을 만들 때 showfliers=False 인수를 사용하여 그림에서 이상값을 제거할 수 있습니다.
sns. boxplot (x=' variable ', y=' value ', data=df, showfliers= False )
이상값 마커의 크기만 변경하려면 fliersize 인수를 사용할 수 있습니다.
sns. boxplot (x=' variable ', y=' value ', data=df, fliersize= 3 )
fliersize 의 기본 크기는 5 입니다.
다음 예에서는 실제로 이러한 인수를 사용하는 방법을 보여줍니다.
예: Seaborn 상자 그림에서 이상값 제거
세 개의 서로 다른 농구 팀의 선수들이 득점한 점수를 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' A ': [5, 7, 7, 9, 12, 78], ' B ': [8, 8, 9, 13, 15, 17], ' C ': [1, 2, 2, 4, 5, 60]}) #melt data frame into long format df_melted = pd. melt (df) #view head of DataFrame print ( df_melted.head ()) variable value 0 to 5 1 to 7 2 to 7 3 to 19 4 to 22
다음 구문을 사용하여 각 팀이 득점한 점수 분포를 보여주는 세 개의 상자 그림을 만들 수 있습니다.
import seaborn as sns
#create boxplot to visualize distribution of points by team
sns. boxplot (x=' variable ', y=' value ', data=df_melted)
기본적으로 seaborn은 다이아몬드 모양의 마커를 사용하여 이상값을 표시합니다.
플롯에서 이러한 이상값을 제거하려면 showfliers=False 인수를 사용할 수 있습니다.
import seaborn as sns
#create boxplots and remove outliers
sns. boxplot (x=' variable ', y=' value ', data=df_melted, showfliers= False )
이상치가 플롯에서 완전히 제거되었습니다.
이상값 마커의 크기를 간단히 변경하려면 fliersize 인수를 사용할 수 있습니다.
import seaborn as sns
#create boxplots and adjust markers for outliers to be smaller
sns. boxplot (x=' variable ', y=' value ', data=df_melted, fliersize= 3 )
특이치에 대한 마커 크기는 훨씬 작습니다.
전단지 크기 값을 자유롭게 조정하여 마커 크기를 원하는 대로 작거나 크게 만들 수 있습니다.
참고 : 여기에서 seaborn.boxplot() 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 seaborn 에서 다른 일반적인 시각화를 만드는 방법을 설명합니다.
Seaborn에서 원형 차트를 만드는 방법
Seaborn에서 면적 차트를 만드는 방법
Seaborn에서 시계열 도표를 만드는 방법