Hoe twee kolommen uit pandas dataframe te plotten
Er zijn twee veelgebruikte manieren om de waarden van twee kolommen in een Panda DataFrame uit te zetten:
Methode 1: Teken twee kolommen als punten op een spreidingsdiagram
import matplotlib. pyplot as plt
plt. scatter (df[' column1 '], df[' column2 '])
Methode 2: Teken twee kolommen als lijnen in een lijngrafiek
df. plot (x=' column1 ',y=[' column2 ',' column3 '])
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken.
Voorbeeld 1: Teken twee kolommen op een spreidingsdiagram
Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
' points ': [18, 22, 19, 14, 14, 11, 20, 28],
' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})
#view DataFrame
print (df)
team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4
We kunnen de volgende code gebruiken om een spreidingsdiagram te maken waarin de puntenkolom op de x-as en de hulpkolom op de y-as wordt weergegeven:
import matplotlib. pyplot as plt
#create scatterplot
plt. scatter (df[' points '], df[' assists '])
#add axis labels
plt. xlabel (' Points ')
plt. ylabel (' Assists ')
De X-as bevat de waarden uit de puntenkolom en de Y-as bevat de waarden uit de assistskolom .
Voorbeeld 2: Teken twee kolommen in een lijngrafiek
Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over de gescoorde punten en toegestane punten door een basketbalteam in zes verschillende games:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' game ': [1, 2, 3, 4, 5, 6],
' points_for ': [99, 94, 92, 90, 87, 85],
' points_against ': [89, 76, 78, 78, 85, 87]})
#view DataFrame
print (df)
game points_for points_against
0 1 99 89
1 2 94 76
2 3 92 78
3 4 90 78
4 5 87 85
5 6 85 87
We kunnen de volgende code gebruiken om een lijndiagram te maken dat de waarden van point_for op de ene regel en points_against op een andere regel weergeeft, terwijl de waarde van game op de x-as wordt gebruikt:
#plot points_for and points_against columns on same y-axis
df. plot (x=' game ', y=[' points_for ', ' points_against '])
De blauwe lijn vertegenwoordigt de punten_voor- kolomwaarden in elk spel en de oranje lijn vertegenwoordigt de punten_tegen- kolomwaarden in elk spel.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:
Groupby en Plot gebruiken in Panda’s
Hoe u de verdeling van kolomwaarden in Panda’s kunt plotten
Hoe u de figuurgrootte van een panda-plot kunt aanpassen