Come tracciare due colonne da pandas dataframe


Esistono due modi comuni per tracciare i valori di due colonne in un DataFrame panda:

Metodo 1: traccia due colonne come punti su un grafico a dispersione

 import matplotlib. pyplot as plt

plt. scatter (df[' column1 '], df[' column2 '])

Metodo 2: traccia due colonne come linee su un grafico a linee

 df. plot (x=' column1 ',y=[' column2 ',' column3 '])

Gli esempi seguenti mostrano come utilizzare ciascun metodo nella pratica.

Esempio 1: traccia due colonne su un grafico a dispersione

Supponiamo di avere il seguente DataFrame panda che contiene informazioni su vari giocatori di basket:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

Possiamo utilizzare il codice seguente per creare un grafico a dispersione che visualizzi la colonna dei punti sull’asse x e la colonna degli assist sull’asse y:

 import matplotlib. pyplot as plt

#create scatterplot
plt. scatter (df[' points '], df[' assists '])

#add axis labels
plt. xlabel (' Points ')
plt. ylabel (' Assists ') 

i panda disegnano due colonne su un grafico a dispersione

L’asse X contiene i valori della colonna dei punti e l’asse Y contiene i valori della colonna degli assist .

Esempio 2: traccia due colonne su un grafico a linee

Supponiamo di avere il seguente DataFrame panda che contiene informazioni sui punti segnati e concessi da una squadra di basket in sei partite diverse:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' game ': [1, 2, 3, 4, 5, 6],
                   ' points_for ': [99, 94, 92, 90, 87, 85],
                   ' points_against ': [89, 76, 78, 78, 85, 87]})

#view DataFrame
print (df)

   game points_for points_against
0 1 99 89
1 2 94 76
2 3 92 78
3 4 90 78
4 5 87 85
5 6 85 87

Possiamo utilizzare il codice seguente per creare un grafico a linee che visualizzi i valori di point_for su una riga e points_against su un’altra riga utilizzando il valore di game sull’asse x:

 #plot points_for and points_against columns on same y-axis
df. plot (x=' game ', y=[' points_for ', ' points_against ']) 

La linea blu rappresenta i valori della colonna points_for in ogni gioco e la linea arancione rappresenta i valori della colonna points_against in ogni gioco.

Risorse addizionali

I seguenti tutorial spiegano come eseguire altre attività comuni nei panda:

Come utilizzare Groupby e Plot in Pandas
Come tracciare la distribuzione dei valori delle colonne in Pandas
Come regolare la dimensione della figura di una trama di panda

Aggiungi un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *