Hoe twee kolommen uit pandas dataframe te plotten


Er zijn twee veelgebruikte manieren om de waarden van twee kolommen in een Panda DataFrame uit te zetten:

Methode 1: Teken twee kolommen als punten op een spreidingsdiagram

 import matplotlib. pyplot as plt

plt. scatter (df[' column1 '], df[' column2 '])

Methode 2: Teken twee kolommen als lijnen in een lijngrafiek

 df. plot (x=' column1 ',y=[' column2 ',' column3 '])

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken.

Voorbeeld 1: Teken twee kolommen op een spreidingsdiagram

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4]})

#view DataFrame
print (df)

  team points assists
0 to 18 5
1 B 22 7
2 C 19 7
3 D 14 9
4 E 14 12
5 F 11 9
6 G 20 9
7:28 a.m. 4

We kunnen de volgende code gebruiken om een spreidingsdiagram te maken waarin de puntenkolom op de x-as en de hulpkolom op de y-as wordt weergegeven:

 import matplotlib. pyplot as plt

#create scatterplot
plt. scatter (df[' points '], df[' assists '])

#add axis labels
plt. xlabel (' Points ')
plt. ylabel (' Assists ') 

panda's tekenen twee kolommen op een spreidingsdiagram

De X-as bevat de waarden uit de puntenkolom en de Y-as bevat de waarden uit de assistskolom .

Voorbeeld 2: Teken twee kolommen in een lijngrafiek

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over de gescoorde punten en toegestane punten door een basketbalteam in zes verschillende games:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' game ': [1, 2, 3, 4, 5, 6],
                   ' points_for ': [99, 94, 92, 90, 87, 85],
                   ' points_against ': [89, 76, 78, 78, 85, 87]})

#view DataFrame
print (df)

   game points_for points_against
0 1 99 89
1 2 94 76
2 3 92 78
3 4 90 78
4 5 87 85
5 6 85 87

We kunnen de volgende code gebruiken om een lijndiagram te maken dat de waarden van point_for op de ene regel en points_against op een andere regel weergeeft, terwijl de waarde van game op de x-as wordt gebruikt:

 #plot points_for and points_against columns on same y-axis
df. plot (x=' game ', y=[' points_for ', ' points_against ']) 

De blauwe lijn vertegenwoordigt de punten_voor- kolomwaarden in elk spel en de oranje lijn vertegenwoordigt de punten_tegen- kolomwaarden in elk spel.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Groupby en Plot gebruiken in Panda’s
Hoe u de verdeling van kolomwaarden in Panda’s kunt plotten
Hoe u de figuurgrootte van een panda-plot kunt aanpassen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert