Pandas에서 범주형 데이터를 그리는 방법(예제 포함)


범주형 데이터를 시각화하는 세 가지 일반적인 방법이 있습니다.

  • 막대 차트
  • 그룹별 상자 그림
  • 모자이크 플롯

다음 예제에서는 Python에서 pandas DataFrame에 대해 이러한 각 플롯을 생성하는 방법을 보여줍니다.

예 1: 막대 차트

다음 코드는 특정 Pandas DataFrame의 이동 빈도를 시각화하기 위해 막대 차트를 만드는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )

팬더에 범주형 데이터 그리기

X축은 각 팀의 이름을 나타내고 Y축은 DataFrame에서 각 팀의 빈도를 나타냅니다.

참고 : rot=0 인수는 팬더에게 x축 레이블이 x축과 평행하도록 x축 레이블을 회전하도록 지시합니다.

예 2: 그룹별 상자 그림

군집 상자 그림은 범주형 변수로 그룹화된 숫자 변수를 시각화하는 유용한 방법입니다.

예를 들어, 다음 코드는 득점한 점수의 분포를 팀별로 그룹화하여 보여주는 상자 그림을 만드는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [18, 22, 29, 25, 14, 11, 10, 15]})

#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')

x축은 팀을 표시하고 y축은 각 팀이 득점한 점수 분포를 표시합니다.

예시 3: 모자이크 플롯

타일형 도표는 단일 도표에 두 개의 서로 다른 범주형 변수의 빈도를 표시하는 도표 유형입니다.

예를 들어, 다음 코드는 단일 플롯에서 범주형 변수 “result” 및 “team”의 빈도를 표시하는 모자이크 플롯을 생성하는 방법을 보여줍니다.

 import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
                   ' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})

#create mosaic plot
mosaic(df, [' team ', ' result ']); 

팬더의 범주형 데이터에 대한 모자이크 플롯

x축은 팀을 표시하고 y축은 각 팀의 결과 빈도를 표시합니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 Groupby 및 Plot을 사용하는 방법
Pandas에서 열 값의 분포를 그리는 방법
팬더 플롯의 그림 크기를 조정하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다