Pandas: crie um gráfico de dispersão usando múltiplas colunas
Você pode usar a seguinte sintaxe básica para criar um gráfico de dispersão usando várias colunas em um DataFrame do pandas:
import pandas as pd #create scatter plot of A vs. B ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ') #add scatter plot on same graph of C vs. D ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)
Este exemplo específico cria um gráfico de dispersão usando as colunas A e B e, em seguida, sobrepõe outro gráfico de dispersão no mesmo gráfico usando as colunas C e D.
O exemplo a seguir mostra como usar essa sintaxe na prática.
Exemplo: crie um gráfico de dispersão do Pandas usando várias colunas
Suponha que temos o seguinte DataFrame do pandas que mostra os pontos e assistências de vários jogadores de basquete dos times A e B:
import pandas as pd #createDataFrame df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9], ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16], ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7], ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]}) #view DataFrame print (df) A_assists A_points B_assists B_points 0 3 6 3 7 1 4 8 4 9 2 5 8 4 9 3 6 10 5 13 4 7 13 5 10 5 7 13 6 11 6 8 15 7 12 7 9 16 7 13
Podemos usar a seguinte sintaxe para criar um gráfico de dispersão usando as colunas A_assists e A_points e , em seguida, sobrepor outro gráfico de dispersão no mesmo gráfico usando as colunas B_assists e B_points :
#create scatter plot of A_assists vs. A_points ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ') #add scatter plot on same graph using B_assists vs. B_points ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1) #specify x-axis and y-axis labels ax1. set_xlabel (' Assists ') ax1. set_ylabel (' Points ')
O resultado final é um gráfico de dispersão que contém os valores das colunas A_assistors e A_points em vermelho e os valores das colunas B_assistors e B_points em verde.
Nota #1 : O argumento label especifica o rótulo a ser usado na legenda do gráfico.
Nota nº 2 : Neste exemplo, usamos dois grupos de colunas para traçar dois gráficos de dispersão no mesmo gráfico. No entanto, você pode usar ax3 , ax4 , etc. para adicionar quantas colunas desejar ao gráfico de dispersão.
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:
Como traçar histogramas por grupo no Pandas
Como plotar dados categóricos no Pandas
Como traçar a distribuição dos valores das colunas no Pandas