Pandas:根据另一个dataframe更新列值


通常,您可能希望使用另一个 DataFrame 的值来更新 pandas DataFrame 的列的值。

幸运的是,使用 pandas 中的merge()函数可以很容易地做到这一点。

以下示例展示了如何执行此操作。

示例:根据另一个 DataFrame 更新 Pandas DataFrame 中的列值

假设我们有以下 pandas DataFrame,其中包含有关各种篮球运动员的信息:

 import pandas as pd

#createDataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                    ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [0, 0, 0, 1, 0, 0, 0, 1]})

#view DataFrame
print (df1)

  team points assists
0 to 18 0
1 B 22 0
2 C 19 0
3 D 14 1
4 E 14 0
5 F 11 0
6 G 20 0
7:28 a.m. 1

现在假设此 DataFrame 中的辅助列值未更新。

但是,假设我们有以下第二个 DataFrame,它已更新辅助列的值:

 #create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                    ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                    ' assists ': [8, 7, 7, 4, 9, 12, 3, 5]})

#view second DataFrame
print (df2)

  team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5

我们可以使用以下语法使用第二个 DataFrame 的辅助列值来更新第一个 DataFrame 的辅助列值:

 #merge two DataFrames
df1 = df1. merge (df2, on=' team ', how=' left ')

#drop original DataFrame columns
df1. drop ([' points_x ', ' assists_x '], inplace= True , axis= 1 )

#rename columns
df1. rename (columns={' points_y ': ' points ', ' assists_y ': ' assists '}, inplace= True )

#view updated DataFrame
print (df1)

  team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5

请注意,第一个 DataFrame 中的辅助列值已使用第二个 DataFrame 中的辅助列值进行更新。

其他资源

以下教程解释了如何在 pandas 中执行其他常见任务:

如何删除 Pandas DataFrame 中的第一行
如何删除 Pandas DataFrame 中的第一列
如何删除 Pandas 中的重复列

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注