Pandas에서 열 값의 분포를 그리는 방법


다음 방법을 사용하여 Pandas DataFrame에서 열 값의 분포를 그릴 수 있습니다.

방법 1: 열의 값 분포 플롯

 df[' my_column ']. plot (kind=' kde ')

방법 2: 한 열의 값 분포를 다른 열로 그룹화하여 표시

 df. groupby (' group_column ')[' values_column ']. plot (kind=' kde ')

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A',
                            'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [3, 3, 4, 5, 4, 7, 7, 7, 10, 11, 
                              8, 7, 8, 9, 12, 12, 12, 14, 15, 17]})

#view DataFrame
print (df)

   team points
0 to 3
1 to 3
2 to 4
3 to 5
4 to 4
5 TO 7
6 to 7
7 to 7
8 to 10
9 to 11
10 B 8
11 B 7
12 B 8
13 B 9
14 B 12
15 B 12
16 B 12
17 B 14
18 B 15
19 B 17

예 1: 열의 값 분포 플롯

다음 코드는 포인트 열의 값 분포를 그리는 방법을 보여줍니다.

 #plot distribution of values in points column
df[' points ']. plot (kind=' kde ')

kind=’kde’는 팬더에게 변수 값의 분포를 요약하는 부드러운 곡선을 생성하는 커널 밀도 추정을 사용하도록 지시합니다.

대신 히스토그램을 생성하려면 다음과 같이 kind=’hist’를 지정하면 됩니다.

 #plot distribution of values in points column using histogram
df[' points ']. plot (kind=' hist ', edgecolor=' black ') 

이 방법은 분포 모양을 요약하는 매끄러운 선과 달리 막대를 사용하여 점 열에 있는 값의 빈도를 나타냅니다.

예 2: 한 열의 값 분포를 다른 열로 그룹화하여 플롯

다음 코드는 열별로 그룹화된 포인트 열의 값 분포를 그리는 방법을 보여줍니다.

 import matplotlib.pyplot as plt

#plot distribution of points by team 
df. groupby (' team ')[' points ']. plot (kind=' kde ')

#add legend
plt. legend ([' A ',' B '], title=' Team ')

#add x-axis label
plt. xlabel (' Points ')

파란색 선은 A팀 선수의 점수 분포를 나타내고, 주황색 선은 B팀 선수의 점수 분포를 나타냅니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 플롯에 제목을 추가하는 방법
팬더 플롯의 그림 크기를 조정하는 방법
서브플롯에 여러 Pandas DataFrame을 그리는 방법
Pandas에서 플롯 범례를 생성하고 사용자 정의하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다