Panda's: update kolomwaarden op basis van een ander dataframe


Vaak wil je misschien de waarden van een kolom van een panda’s DataFrame bijwerken met behulp van de waarden van een ander DataFrame.

Gelukkig is dit eenvoudig te doen met de functie merge() in panda’s.

Het volgende voorbeeld laat zien hoe u dit doet.

Voorbeeld: Update kolomwaarden in Pandas DataFrame op basis van een ander DataFrame

Stel dat we het volgende panda’s DataFrame hebben dat informatie bevat over verschillende basketbalspelers:

 import pandas as pd

#createDataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                    ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [0, 0, 0, 1, 0, 0, 0, 1]})

#view DataFrame
print (df1)

  team points assists
0 to 18 0
1 B 22 0
2 C 19 0
3 D 14 1
4 E 14 0
5 F 11 0
6 G 20 0
7:28 a.m. 1

Stel nu dat de helperkolomwaarden niet worden bijgewerkt in dit DataFrame.

Laten we echter aannemen dat we het volgende tweede DataFrame hebben met bijgewerkte waarden voor de helperkolom :

 #create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                    ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [8, 7, 7, 4, 9, 12, 3, 5]})

#view second DataFrame
print (df2)

  team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5

We kunnen de volgende syntaxis gebruiken om de helperkolomwaarden van het eerste DataFrame bij te werken met behulp van de helperkolomwaarden van het tweede DataFrame:

 #merge two DataFrames
df1 = df1. merge (df2, on=' team ', how=' left ')

#drop original DataFrame columns
df1. drop ([' points_x ', ' assists_x '], inplace= True , axis= 1 )

#rename columns
df1. rename (columns={' points_y ': ' points ', ' assists_y ': ' assists '}, inplace= True )

#view updated DataFrame
print (df1)

  team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5

Houd er rekening mee dat de helperkolomwaarden uit het eerste DataFrame zijn bijgewerkt met behulp van de helperkolomwaarden uit het tweede DataFrame.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe de eerste rij in Pandas DataFrame te verwijderen
Hoe de eerste kolom in Pandas DataFrame te verwijderen
Hoe dubbele kolommen in Pandas te verwijderen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert