Panda's: maak een spreidingsdiagram met meerdere kolommen


U kunt de volgende basissyntaxis gebruiken om een spreidingsdiagram te maken met meerdere kolommen in een pandas DataFrame:

 import pandas as pd

#create scatter plot of A vs. B
ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ')

#add scatter plot on same graph of C vs. D
ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)

In dit specifieke voorbeeld wordt een spreidingsdiagram gemaakt met behulp van de kolommen A en B, en vervolgens wordt er een ander spreidingsdiagram op hetzelfde diagram gelegd met behulp van de kolommen C en D.

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: maak een Pandas-scatterplot met meerdere kolommen

Stel dat we het volgende panda’s DataFrame hebben dat de punten en assists toont van verschillende basketbalspelers van Team A en B:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9],
                   ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16],
                   ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7],
                   ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]})
#view DataFrame
print (df)

   A_assists A_points B_assists B_points
0 3 6 3 7
1 4 8 4 9
2 5 8 4 9
3 6 10 5 13
4 7 13 5 10
5 7 13 6 11
6 8 15 7 12
7 9 16 7 13

We kunnen de volgende syntaxis gebruiken om een spreidingsdiagram te maken met behulp van de kolommen A_assists en A_points , en vervolgens een ander spreidingsdiagram over dezelfde grafiek heen leggen met behulp van de kolommen B_assisties en B_points :

 #create scatter plot of A_assists vs. A_points
ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ')

#add scatter plot on same graph using B_assists vs. B_points
ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1)

#specify x-axis and y-axis labels
ax1. set_xlabel (' Assists ')
ax1. set_ylabel (' Points ') 

panda's scatterplot met behulp van meerdere kolommen

Het eindresultaat is een spreidingsdiagram waarin de waarden van de kolommen A_assistors en A_points in rood zijn weergegeven en de waarden van de kolommen B_assistors en B_points in groen.

Opmerking #1 : Het labelargument specificeert het label dat in de plotlegenda moet worden gebruikt.

Opmerking 2 : In dit voorbeeld hebben we twee groepen kolommen gebruikt om twee spreidingsdiagrammen in dezelfde grafiek uit te zetten. U kunt echter ax3 , ax4 , enz. gebruiken. om zoveel kolommen als u wilt aan het spreidingsdiagram toe te voegen.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe histogrammen per groep in Panda’s te plotten
Hoe categorische gegevens in Panda’s te plotten
Hoe u de verdeling van kolomwaarden in Panda’s kunt plotten

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert