Pandas で vlookup を実行する方法


次の基本構文を使用して、pandas で VLOOKUP (Excel に似た) を実行できます。

 p.d. merge (df1,
         df2,
         on = ' column_name ',
         how = ' left ')

次の段階的な例は、この構文を実際に使用する方法を示しています。

ステップ 1: 2 つの DataFrame を作成する

まず、パンダをインポートし、2 つのパンダ DataFrame を作成しましょう。

 import pandas as pd

#define first DataFrame
df1 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' team ': ['Mavs', 'Mavs', 'Mavs', 'Mavs', 'Nets', 'Nets']})

#define second DataFrame
df2 = pd. DataFrame ({' player ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [22, 29, 34, 20, 15, 19]})

#view df1
print (df1)

  player team
0 A Mavs
1 B Mavs
2C Mavs
3 D Mavs
4 E Nets
5 F Nets

#view df2
print (df2)

  player points
0 to 22
1 B 29
2 C 34
3 D 20
4 E 15
5 F 19

ステップ 2: VLOOKUP 関数を実行する

Excel のVLOOKUP関数を使用すると、列を照合してテーブル内の値を見つけることができます。

次のコードは、 pd.merge()を使用してプレーヤーのチームを検索し、2 つのテーブル間でプレーヤー名を照合し、プレーヤーのチームを返す方法を示しています。

 #perform VLOOKUP
joined_df = pd. merge (df1,
                     df2,
                     we = ' player ',
                     how = ' left ')

#view results
joined_df

	player team points
0 A Mavs 22
1 B Mavs 29
2 C Mavs 34
3D Mavs 20
4 E Nets 15
5 F Nets 19

結果のパンダ データフレームには、プレーヤー、そのチーム、および得点に関する情報が含まれることに注意してください。

pandas merge()関数の完全なオンライン ドキュメントは、ここで見つけることができます。

追加リソース

次のチュートリアルでは、Python で他の一般的な操作を実行する方法について説明します。

Python でピボットテーブルを作成する方法
Pythonで相関関係を計算する方法
Python でパーセンタイルを計算する方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です