Panda's: maak een spreidingsdiagram met meerdere kolommen
U kunt de volgende basissyntaxis gebruiken om een spreidingsdiagram te maken met meerdere kolommen in een pandas DataFrame:
import pandas as pd #create scatter plot of A vs. B ax1 = df. plot (kind=' scatter ', x=' A ', y=' B ', color=' r ') #add scatter plot on same graph of C vs. D ax2 = df. plot (kind=' scatter ', x=' C ', y=' D ', color=' g ', ax=ax1)
In dit specifieke voorbeeld wordt een spreidingsdiagram gemaakt met behulp van de kolommen A en B, en vervolgens wordt er een ander spreidingsdiagram op hetzelfde diagram gelegd met behulp van de kolommen C en D.
Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.
Voorbeeld: maak een Pandas-scatterplot met meerdere kolommen
Stel dat we het volgende panda’s DataFrame hebben dat de punten en assists toont van verschillende basketbalspelers van Team A en B:
import pandas as pd #createDataFrame df = pd. DataFrame ({' A_assists ': [3, 4, 5, 6, 7, 7, 8, 9], ' A_points ': [6, 8, 8, 10, 13, 13, 15, 16], ' B_assists ': [3, 4, 4, 5, 5, 6, 7, 7], ' B_points ': [7, 9, 9, 13, 10, 11, 12, 13]}) #view DataFrame print (df) A_assists A_points B_assists B_points 0 3 6 3 7 1 4 8 4 9 2 5 8 4 9 3 6 10 5 13 4 7 13 5 10 5 7 13 6 11 6 8 15 7 12 7 9 16 7 13
We kunnen de volgende syntaxis gebruiken om een spreidingsdiagram te maken met behulp van de kolommen A_assists en A_points , en vervolgens een ander spreidingsdiagram over dezelfde grafiek heen leggen met behulp van de kolommen B_assisties en B_points :
#create scatter plot of A_assists vs. A_points ax1=df. plot (kind=' scatter ', x=' A_assists ', y=' A_points ', color=' r ', label=' A ') #add scatter plot on same graph using B_assists vs. B_points ax2=df. plot (kind=' scatter ', x=' B_assists ', y=' B_points ', color=' g ', label=' B ', ax=ax1) #specify x-axis and y-axis labels ax1. set_xlabel (' Assists ') ax1. set_ylabel (' Points ')
Het eindresultaat is een spreidingsdiagram waarin de waarden van de kolommen A_assistors en A_points in rood zijn weergegeven en de waarden van de kolommen B_assistors en B_points in groen.
Opmerking #1 : Het labelargument specificeert het label dat in de plotlegenda moet worden gebruikt.
Opmerking 2 : In dit voorbeeld hebben we twee groepen kolommen gebruikt om twee spreidingsdiagrammen in dezelfde grafiek uit te zetten. U kunt echter ax3 , ax4 , enz. gebruiken. om zoveel kolommen als u wilt aan het spreidingsdiagram toe te voegen.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Hoe histogrammen per groep in Panda’s te plotten
Hoe categorische gegevens in Panda’s te plotten
Hoe u de verdeling van kolomwaarden in Panda’s kunt plotten