Pandas で vlookup を実行する方法
次の基本構文を使用して、pandas で VLOOKUP (Excel に似た) を実行できます。
p.d. merge (df1, df2, on = ' column_name ', how = ' left ')
次の段階的な例は、この構文を実際に使用する方法を示しています。
ステップ 1: 2 つの DataFrame を作成する
まず、パンダをインポートし、2 つのパンダ DataFrame を作成しましょう。
import pandas as pd #define first DataFrame df1 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'], ' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Nets', 'Nets']}) #define second DataFrame df2 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'], ' points ': [22, 29, 34, 20, 15, 19]}) #view df1 print (df1) player team 0 A Mavs 1 B Mavs 2C Mavs 3 D Mavs 4 E Nets 5 F Nets #view df2 print (df2) player points 0 to 22 1 B 29 2 C 34 3 D 20 4 E 15 5 F 19
ステップ 2: VLOOKUP 関数を実行する
Excel のVLOOKUP関数を使用すると、列を照合してテーブル内の値を見つけることができます。
次のコードは、 pd.merge()を使用してプレーヤーのチームを検索し、2 つのテーブル間でプレーヤー名を照合し、プレーヤーのチームを返す方法を示しています。
#perform VLOOKUP joined_df = pd. merge (df1, df2, we = ' player ', how = ' left ') #view results joined_df player team points 0 A Mavs 22 1 B Mavs 29 2 C Mavs 34 3D Mavs 20 4 E Nets 15 5 F Nets 19
結果のパンダ データフレームには、プレーヤー、そのチーム、および得点に関する情報が含まれることに注意してください。
pandas merge()関数の完全なオンライン ドキュメントは、ここで見つけることができます。
追加リソース
次のチュートリアルでは、Python で他の一般的な操作を実行する方法について説明します。
Python でピボットテーブルを作成する方法
Pythonで相関関係を計算する方法
Python でパーセンタイルを計算する方法