Як виконати перехресне з’єднання в pandas (з прикладом)


Ви можете використовувати наступний базовий синтаксис для виконання перехресного з’єднання в pandaх:

 #create common key
df1[' key '] = 0
df2[' key '] = 0

#outer merge on common key (eg a cross join)
df1. merge (df2, on=' key ', how=' outer ')

У наступному прикладі показано, як використовувати цю функцію на практиці.

Приклад: виконання перехресного з’єднання в Pandas

Припустімо, що ми маємо наступні два panda DataFrames:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'],
                    ' points ': [18, 22, 19, 14]})

print (df1)

  team points
0 to 18
1 B 22
2 C 19
3 D 14

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'F'],
                    ' assists ': [4, 9, 8]})

print (df2)

  team assists
0 to 4
1 B 9
2 F 8

Наступний код показує, як виконати перехресне з’єднання двох DataFrames:

 #create common key
df1[' key '] = 0
df2[' key '] = 0

#perform cross join
df3 = df1. merge (df2, on=' key ', how=' outer ')

#drop key column
del df3[' key ']

#view results
print (df3)

   team_x points team_y assists
0 A 18 A 4
1 A 18 B 9
2 A 18 F 8
3 B 22 A 4
4 B 22 B 9
5 B 22 F 8
6 C 19 A 4
7 C 19 B 9
8 C 19 F 8
9 D 14 A 4
10 D 14 B 9
11 D 14 F 8

Результатом є DataFrame, який містить усі можливі комбінації рядків із кожного DataFrame.

Наприклад, перший рядок першого DataFrame містить команду A та 18 точок. Цей рядок відповідає кожному рядку другого DataFrame.

Тоді другий рядок першого DataFrame містить команду B і 22 точки. Цей рядок також відповідає кожному рядку другого DataFrame.

Кінцевим результатом є DataFrame з 12 рядками.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Як зробити об’єднання зліва в Pandas
Як зробити об’єднання зліва в Pandas
Pandas Join або Merge: у чому різниця?

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *