Pandas: crie um gráfico de dispersão usando múltiplas colunas


Você pode usar a seguinte sintaxe básica para criar um gráfico de dispersão usando várias colunas em um DataFrame do pandas:

 import pandas as pd

#create scatter plot of A vs. B
ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ')

#add scatter plot on same graph of C vs. D
ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)

Este exemplo específico cria um gráfico de dispersão usando as colunas A e B e, em seguida, sobrepõe outro gráfico de dispersão no mesmo gráfico usando as colunas C e D.

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: crie um gráfico de dispersão do Pandas usando várias colunas

Suponha que temos o seguinte DataFrame do pandas que mostra os pontos e assistências de vários jogadores de basquete dos times A e B:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9],
                   ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16],
                   ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7],
                   ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]})
#view DataFrame
print (df)

   A_assists A_points B_assists B_points
0 3 6 3 7
1 4 8 4 9
2 5 8 4 9
3 6 10 5 13
4 7 13 5 10
5 7 13 6 11
6 8 15 7 12
7 9 16 7 13

Podemos usar a seguinte sintaxe para criar um gráfico de dispersão usando as colunas A_assists e A_points e , em seguida, sobrepor outro gráfico de dispersão no mesmo gráfico usando as colunas B_assists e B_points :

 #create scatter plot of A_assists vs. A_points
ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ')

#add scatter plot on same graph using B_assists vs. B_points
ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1)

#specify x-axis and y-axis labels
ax1. set_xlabel (' Assists ')
ax1. set_ylabel (' Points ') 

gráfico de dispersão do pandas usando múltiplas colunas

O resultado final é um gráfico de dispersão que contém os valores das colunas A_assistors e A_points em vermelho e os valores das colunas B_assistors e B_points em verde.

Nota #1 : O argumento label especifica o rótulo a ser usado na legenda do gráfico.

Nota nº 2 : Neste exemplo, usamos dois grupos de colunas para traçar dois gráficos de dispersão no mesmo gráfico. No entanto, você pode usar ax3 , ax4 , etc. para adicionar quantas colunas desejar ao gráfico de dispersão.

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras tarefas comuns em pandas:

Como traçar histogramas por grupo no Pandas
Como plotar dados categóricos no Pandas
Como traçar a distribuição dos valores das colunas no Pandas

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *