Como fazer um vlookup no pandas
Você pode usar a seguinte sintaxe básica para realizar um VLOOKUP (semelhante ao Excel) no pandas:
p.d. merge (df1, df2, on = ' column_name ', how = ' left ')
O exemplo passo a passo a seguir mostra como usar essa sintaxe na prática.
Etapa 1: crie dois DataFrames
Primeiro, vamos importar pandas e criar dois DataFrames de pandas:
import pandas as pd #define first DataFrame df1 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'], ' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Nets', 'Nets']}) #define second DataFrame df2 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [22, 29, 34, 20, 15, 19]}) #view df1 print (df1) player team 0 A Mavs 1 B Mavs 2C Mavs 3 D Mavs 4 E Nets 5 F Nets #view df2 print (df2) player points 0 to 22 1 B 29 2 C 34 3 D 20 4 E 15 5 F 19
Etapa 2: execute a função VLOOKUP
A função VLOOKUP no Excel permite encontrar um valor em uma tabela comparando-o em uma coluna.
O código a seguir mostra como encontrar o time de um jogador usando pd.merge() para combinar os nomes dos jogadores entre as duas tabelas e retornar o time do jogador:
#perform VLOOKUP joined_df = pd. merge (df1, df2, we = ' player ', how = ' left ') #view results joined_df player team points 0 A Mavs 22 1 B Mavs 29 2 C Mavs 34 3D Mavs 20 4 E Nets 15 5 F Nets 19
Observe que o DataFrame do pandas resultante contém informações sobre o jogador, seu time e pontos marcados.
Você pode encontrar a documentação online completa da função merge() do pandas aqui .
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras operações comuns em Python:
Como criar tabelas dinâmicas em Python
Como calcular a correlação em Python
Como calcular percentis em Python