Pandas: 別の dataframe に基づいて列の値を更新します


多くの場合、別の DataFrame の値を使用して pandas DataFrame の列の値を更新したい場合があります。

幸いなことに、これはパンダのmerge()関数を使用して簡単に行うことができます。

次の例は、これを行う方法を示しています。

例: 別の DataFrame に基づいて Pandas DataFrame の列値を更新する

さまざまなバスケットボール選手に関する情報を含む次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                    ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [0, 0, 0, 1, 0, 0, 0, 1]})

#view DataFrame
print (df1)

  team points assists
0 to 18 0
1 B 22 0
2 C 19 0
3 D 14 1
4 E 14 0
5 F 11 0
6 G 20 0
7:28 a.m. 1

ここで、ヘルパー列の値がこの DataFrame で更新されていないと仮定します。

ただし、ヘルパー列の値が更新された次の 2 番目の DataFrame があると仮定します。

 #create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                    ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [8, 7, 7, 4, 9, 12, 3, 5]})

#view second DataFrame
print (df2)

  team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5

次の構文を使用して、2 番目の DataFrame のヘルパー列値を使用して最初の DataFrame のヘルパー列値を更新できます。

 #merge two DataFrames
df1 = df1. merge (df2, on=' team ', how=' left ')

#drop original DataFrame columns
df1. drop ([' points_x ', ' assists_x '], inplace= True , axis= 1 )

#rename columns
df1. rename (columns={' points_y ': ' points ', ' assists_y ': ' assists '}, inplace= True )

#view updated DataFrame
print (df1)

  team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5

最初の DataFrame のヘルパー列の値が、2 番目の DataFrame のヘルパー列の値を使用して更新されていることに注意してください。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

Pandas DataFrame の最初の行を削除する方法
Pandas DataFrame の最初の列を削除する方法
Pandasで重複した列を削除する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です