Pandas: 여러 열을 사용하여 분산형 차트 만들기
다음 기본 구문을 사용하여 Pandas DataFrame의 여러 열을 사용하는 산점도를 만들 수 있습니다.
import pandas as pd #create scatter plot of A vs. B ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ') #add scatter plot on same graph of C vs. D ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)
이 특정 예에서는 A 열과 B 열을 사용하여 산점도를 만든 다음 C 열과 D 열을 사용하여 동일한 차트에 다른 산점도를 오버레이합니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: 여러 열을 사용하여 Pandas 산점도 생성
A팀과 B팀의 다양한 농구 선수들의 포인트와 어시스트를 보여주는 다음과 같은 팬더 DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9], ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16], ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7], ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]}) #view DataFrame print (df) A_assists A_points B_assists B_points 0 3 6 3 7 1 4 8 4 9 2 5 8 4 9 3 6 10 5 13 4 7 13 5 10 5 7 13 6 11 6 8 15 7 12 7 9 16 7 13
다음 구문을 사용하여 A_assists 및 A_points 열을 사용하여 산점도를 만든 다음 B_assists 및 B_points 열을 사용하여 동일한 그래프에 다른 산점도를 오버레이할 수 있습니다.
#create scatter plot of A_assists vs. A_points ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ') #add scatter plot on same graph using B_assists vs. B_points ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1) #specify x-axis and y-axis labels ax1. set_xlabel (' Assists ') ax1. set_ylabel (' Points ')
최종 결과는 A_assistors 및 A_points 열의 값이 빨간색으로, B_assistors 및 B_points 열의 값이 녹색으로 포함된 산점도입니다.
참고 #1 : label 인수는 플롯 범례에 사용할 레이블을 지정합니다.
참고 #2 : 이 예에서는 두 개의 열 그룹을 사용하여 동일한 그래프에 두 개의 산점도를 그렸습니다. 그러나 ax3 , ax4 등을 사용할 수 있습니다. 산점도에 원하는 만큼의 열을 추가합니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 그룹별로 히스토그램을 그리는 방법
Pandas에서 범주형 데이터를 그리는 방법
Pandas에서 열 값의 분포를 그리는 방법