Panda's sluiten zich aan of voegen zich samen: wat is het verschil?


De functies join() en merge() kunnen worden gebruikt om twee panda’s DataFrames te combineren.

Hier is het belangrijkste verschil tussen de twee functies:

  • De functie join() combineert twee DataFrames per index.
  • De functie merge() combineert twee DataFrames op basis van de kolom die u opgeeft.

Deze functies gebruiken de volgende basissyntaxis:

 #use join() to combine two DataFrames by index
df1. join (df2)

#use merge() to combine two DataFrames by specific column name
df1. merge (df2,on=' column_name ')

In gevallen waarin u weet dat u twee DataFrames via index wilt samenvoegen, kan de functie join() worden gebruikt om typen te besparen.

De volgende voorbeelden laten zien hoe u elke functie in de praktijk kunt gebruiken.

Voorbeeld 1: Hoe de functie join() te gebruiken

De volgende code laat zien hoe u de functie join() gebruikt om twee DataFrames te combineren:

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. join (df2)

	steal points
name		
At 8 4
B 12 5
C 19 2

Standaard koppelt de functie join() de twee DataFrames aan elkaar met behulp van de indexkolom.

Voorbeeld 2: Hoe de functie merge() te gebruiken

De volgende code laat zien hoe u de functie merge() gebruikt om twee DataFrames te combineren:

 import pandas as pd

#create two DataFrames
df1 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' points ': [8, 12, 19]}). set_index (' name ')
df2 = pd. DataFrame ({' name ': ['A', 'B', 'C'], ' steals ': [4, 5, 2]}). set_index (' name ')

#view two DataFrames
print (df1); print (df2)

      steal points
name name
A 8 A 4
B 12 B 5
C 19 C 2

#use join() function to join together two DataFrames
df1. merge (df2, on=' name ')

	steal points
name		
At 8 4
B 12 5
C 19 2

Merk op dat de functie merge() exact hetzelfde resultaat retourneerde, maar we moesten de panda’s expliciet vertellen dat ze zich bij de DataFrames moesten aansluiten met behulp van de kolom „naam“.

Aanvullende bronnen

De volledige online documentatie voor de functies join() en merge() vindt u hier:

Documentatie voor de join()-functie
Documentatie voor de functie merge().

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende functies in panda’s kunt uitvoeren:

Rijen toevoegen aan een Pandas DataFrame
Hoe u een koprij toevoegt aan Pandas DataFrame
Hoe u de eerste rij Pandas DataFrame kunt krijgen
Hoe u de eerste kolom uit Pandas DataFrame kunt halen

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert