Pandas: 여러 열을 사용하여 분산형 차트 만들기


다음 기본 구문을 사용하여 Pandas DataFrame의 여러 열을 사용하는 산점도를 만들 수 있습니다.

 import pandas as pd

#create scatter plot of A vs. B
ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ')

#add scatter plot on same graph of C vs. D
ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)

이 특정 예에서는 A 열과 B 열을 사용하여 산점도를 만든 다음 C 열과 D 열을 사용하여 동일한 차트에 다른 산점도를 오버레이합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: 여러 열을 사용하여 Pandas 산점도 생성

A팀과 B팀의 다양한 농구 선수들의 포인트와 어시스트를 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9],
                   ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16],
                   ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7],
                   ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]})
#view DataFrame
print (df)

   A_assists A_points B_assists B_points
0 3 6 3 7
1 4 8 4 9
2 5 8 4 9
3 6 10 5 13
4 7 13 5 10
5 7 13 6 11
6 8 15 7 12
7 9 16 7 13

다음 구문을 사용하여 A_assistsA_points 열을 사용하여 산점도를 만든 다음 B_assistsB_points 열을 사용하여 동일한 그래프에 다른 산점도를 오버레이할 수 있습니다.

 #create scatter plot of A_assists vs. A_points
ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ')

#add scatter plot on same graph using B_assists vs. B_points
ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1)

#specify x-axis and y-axis labels
ax1. set_xlabel (' Assists ')
ax1. set_ylabel (' Points ') 

여러 열을 사용하는 팬더 산점도

최종 결과는 A_assistorsA_points 열의 값이 빨간색으로, B_assistorsB_points 열의 값이 녹색으로 포함된 산점도입니다.

참고 #1 : label 인수는 플롯 범례에 사용할 레이블을 지정합니다.

참고 #2 : 이 예에서는 두 개의 열 그룹을 사용하여 동일한 그래프에 두 개의 산점도를 그렸습니다. 그러나 ax3 , ax4 등을 사용할 수 있습니다. 산점도에 원하는 만큼의 열을 추가합니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 그룹별로 히스토그램을 그리는 방법
Pandas에서 범주형 데이터를 그리는 방법
Pandas에서 열 값의 분포를 그리는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다