Comment effectuer une RECHERCHEV dans Pandas
Vous pouvez utiliser la syntaxe de base suivante pour effectuer une RECHERCHEV (similaire à Excel) dans les pandas :
pd.merge(df1, df2, on ='column_name', how ='left')
L’exemple suivant étape par étape montre comment utiliser cette syntaxe dans la pratique.
Étape 1 : Créer deux DataFrames
Tout d’abord, importons des pandas et créons deux DataFrames pandas :
import pandas as pd #define first DataFrame df1 = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F'], 'team': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Nets', 'Nets']}) #define second DataFrame df2 = pd.DataFrame({'player': ['A', 'B', 'C', 'D', 'E', 'F'], 'points': [22, 29, 34, 20, 15, 19]}) #view df1 print(df1) player team 0 A Mavs 1 B Mavs 2 C Mavs 3 D Mavs 4 E Nets 5 F Nets #view df2 print(df2) player points 0 A 22 1 B 29 2 C 34 3 D 20 4 E 15 5 F 19
Étape 2 : Exécuter la fonction RECHERCHEV
La fonction RECHERCHEV dans Excel vous permet de rechercher une valeur dans un tableau en la faisant correspondre sur une colonne.
Le code suivant montre comment rechercher l’équipe d’un joueur en utilisant pd.merge() pour faire correspondre les noms des joueurs entre les deux tables et renvoyer l’équipe du joueur :
#perform VLOOKUP joined_df = pd.merge(df1, df2, on ='player', how ='left') #view results joined_df player team points 0 A Mavs 22 1 B Mavs 29 2 C Mavs 34 3 D Mavs 20 4 E Nets 15 5 F Nets 19
Notez que le DataFrame pandas résultant contient des informations sur le joueur, son équipe et les points marqués.
Vous pouvez trouver la documentation complète en ligne de la fonction pandas merge() ici .
Ressources additionnelles
Les didacticiels suivants expliquent comment effectuer d’autres opérations courantes en Python :
Comment créer des tableaux croisés dynamiques en Python
Comment calculer la corrélation en Python
Comment calculer les centiles en Python