Pandas: создайте точечную диаграмму, используя несколько столбцов
Вы можете использовать следующий базовый синтаксис для создания диаграммы рассеяния с использованием нескольких столбцов в DataFrame pandas:
import pandas as pd #create scatter plot of A vs. B ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ') #add scatter plot on same graph of C vs. D ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)
В этом конкретном примере создается диаграмма рассеяния с использованием столбцов A и B, а затем накладывается другая диаграмма рассеяния на ту же диаграмму с использованием столбцов C и D.
В следующем примере показано, как использовать этот синтаксис на практике.
Пример. Создание диаграммы рассеяния Pandas с использованием нескольких столбцов
Предположим, у нас есть следующий DataFrame pandas, который показывает очки и передачи различных баскетболистов из команд A и B:
import pandas as pd #createDataFrame df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9], ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16], ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7], ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]}) #view DataFrame print (df) A_assists A_points B_assists B_points 0 3 6 3 7 1 4 8 4 9 2 5 8 4 9 3 6 10 5 13 4 7 13 5 10 5 7 13 6 11 6 8 15 7 12 7 9 16 7 13
Мы можем использовать следующий синтаксис, чтобы создать диаграмму рассеяния с использованием столбцов A_assists и A_points , а затем наложить другую диаграмму рассеяния на тот же график, используя столбцы B_assists и B_points :
#create scatter plot of A_assists vs. A_points ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ') #add scatter plot on same graph using B_assists vs. B_points ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1) #specify x-axis and y-axis labels ax1. set_xlabel (' Assists ') ax1. set_ylabel (' Points ')
Конечным результатом является диаграмма рассеяния, содержащая значения столбцов A_assistors и A_points красным цветом и значения столбцов B_assistors и B_points зеленым цветом.
Примечание № 1. Аргумент label указывает метку, которая будет использоваться в легенде графика.
Примечание № 2. В этом примере мы использовали две группы столбцов для построения двух диаграмм рассеяния на одном графике. Однако вы можете использовать ax3 , ax4 и т. д. чтобы добавить в диаграмму рассеяния столько столбцов, сколько вы хотите.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как построить гистограммы по группам в Pandas
Как построить категориальные данные в Pandas
Как построить график распределения значений столбцов в Pandas