Pandas: обновить значения столбцов на основе другого dataframe
Часто вам может потребоваться обновить значения столбца DataFrame pandas, используя значения другого DataFrame.
К счастью, это легко сделать с помощью функции merge() в pandas.
В следующем примере показано, как это сделать.
Пример: обновить значения столбца в Pandas DataFrame на основе другого DataFrame.
Предположим, у нас есть следующий DataFrame pandas, содержащий информацию о различных баскетболистах:
import pandas as pd #createDataFrame df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [0, 0, 0, 1, 0, 0, 0, 1]}) #view DataFrame print (df1) team points assists 0 to 18 0 1 B 22 0 2 C 19 0 3 D 14 1 4 E 14 0 5 F 11 0 6 G 20 0 7:28 a.m. 1
Теперь предположим, что значения вспомогательного столбца не обновляются в этом DataFrame.
Однако предположим, что у нас есть следующий второй DataFrame, в котором обновлены значения для вспомогательного столбца:
#create second DataFrame df2 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, 28], ' assists ': [8, 7, 7, 4, 9, 12, 3, 5]}) #view second DataFrame print (df2) team points assists 0 to 18 8 1 B 22 7 2 C 19 7 3 D 14 4 4 E 14 9 5 F 11 12 6 G 20 3 7:28 5
Мы можем использовать следующий синтаксис для обновления значений вспомогательного столбца первого DataFrame, используя значения вспомогательного столбца второго DataFrame:
#merge two DataFrames
df1 = df1. merge (df2, on=' team ', how=' left ')
#drop original DataFrame columns
df1. drop ([' points_x ', ' assists_x '], inplace= True , axis= 1 )
#rename columns
df1. rename (columns={' points_y ': ' points ', ' assists_y ': ' assists '}, inplace= True )
#view updated DataFrame
print (df1)
team points assists
0 to 18 8
1 B 22 7
2 C 19 7
3 D 14 4
4 E 14 9
5 F 11 12
6 G 20 3
7:28 5
Обратите внимание, что значения вспомогательного столбца из первого DataFrame были обновлены с использованием значений вспомогательного столбца из второго DataFrame.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Как удалить первую строку в Pandas DataFrame
Как удалить первый столбец в Pandas DataFrame
Как удалить повторяющиеся столбцы в Pandas