Een kruisverbinding uitvoeren in panda's (met voorbeeld)


U kunt de volgende basissyntaxis gebruiken om een cross-join in panda’s uit te voeren:

 #create common key
df1[' key '] = 0
df2[' key '] = 0

#outer merge on common key (eg a cross join)
df1. merge (df2, on=' key ', how=' outer ')

Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.

Voorbeeld: een kruisverbinding uitvoeren in Panda’s

Laten we aannemen dat we de volgende twee panda-dataframes hebben:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D'],
                    ' points ': [18, 22, 19, 14]})

print (df1)

  team points
0 to 18
1 B 22
2 C 19
3 D 14

#create second DataFrame
df2 = pd. DataFrame ({' team ': ['A', 'B', 'F'],
                    ' assists ': [4, 9, 8]})

print (df2)

  team assists
0 to 4
1 B 9
2 F 8

De volgende code laat zien hoe u een cross-join uitvoert op de twee DataFrames:

 #create common key
df1[' key '] = 0
df2[' key '] = 0

#perform cross join
df3 = df1. merge (df2, on=' key ', how=' outer ')

#drop key column
del df3[' key ']

#view results
print (df3)

   team_x points team_y assists
0 A 18 A 4
1 A 18 B 9
2 A 18 F 8
3 B 22 A 4
4 B 22 B 9
5 B 22 F 8
6 C 19 A 4
7 C 19 B 9
8 C 19 F 8
9 D 14 A 4
10 D 14 B 9
11 D 14 F 8

Het resultaat is een DataFrame dat alle mogelijke combinaties van rijen uit elk DataFrame bevat.

De eerste rij van het eerste DataFrame bevat bijvoorbeeld Team A en 18 punten. Deze regel komt overeen met elke regel van het tweede DataFrame.

Dan bevat de tweede rij van het eerste DataFrame Team B en 22 punten. Deze rij komt ook overeen met elke rij van het tweede DataFrame.

Het eindresultaat is een DataFrame met 12 rijen.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in panda’s kunt uitvoeren:

Hoe je een left join doet in Pandas
Hoe je een left join doet in Pandas
Panda’s sluiten zich aan of voegen zich samen: wat is het verschil?

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert