Como fazer um vlookup no pandas


Você pode usar a seguinte sintaxe básica para realizar um VLOOKUP (semelhante ao Excel) no pandas:

 p.d. merge (df1,
         df2,
         on = ' column_name ',
         how = ' left ')

O exemplo passo a passo a seguir mostra como usar essa sintaxe na prática.

Etapa 1: crie dois DataFrames

Primeiro, vamos importar pandas e criar dois DataFrames de pandas:

 import pandas as pd

#define first DataFrame
df1 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Nets', 'Nets']})

#define second DataFrame
df2 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [22, 29, 34, 20, 15, 19]})

#view df1
print (df1)

  player team
0 A Mavs
1 B Mavs
2C Mavs
3 D Mavs
4 E Nets
5 F Nets

#view df2
print (df2)

  player points
0 to 22
1 B 29
2 C 34
3 D 20
4 E 15
5 F 19

Etapa 2: execute a função VLOOKUP

A função VLOOKUP no Excel permite encontrar um valor em uma tabela comparando-o em uma coluna.

O código a seguir mostra como encontrar o time de um jogador usando pd.merge() para combinar os nomes dos jogadores entre as duas tabelas e retornar o time do jogador:

 #perform VLOOKUP
joined_df = pd. merge (df1,
                     df2,
                     we = ' player ',
                     how = ' left ')

#view results
joined_df

	player team points
0 A Mavs 22
1 B Mavs 29
2 C Mavs 34
3D Mavs 20
4 E Nets 15
5 F Nets 19

Observe que o DataFrame do pandas resultante contém informações sobre o jogador, seu time e pontos marcados.

Você pode encontrar a documentação online completa da função merge() do pandas aqui .

Recursos adicionais

Os tutoriais a seguir explicam como realizar outras operações comuns em Python:

Como criar tabelas dinâmicas em Python
Como calcular a correlação em Python
Como calcular percentis em Python

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *