Pandy: jak połączyć dwie ramki danych z różnymi nazwami kolumn


Możesz użyć następującej podstawowej składni, aby połączyć dwie ramki danych pand o różnych nazwach kolumn:

 p.d. merge (df1, df2, left_on=' left_column_name ', right_on=' right_column_name ')

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Połącz dwie ramki danych Pandas z różnymi nazwami kolumn

Załóżmy, że mamy następujące dwie ramki danych pandy:

 import pandas as pd

#create first DataFrame
df1 = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' points ': [4, 4, 6, 8, 9, 5]})

#view DataFrame
print (df1)

  team points
0 to 4
1 B 4
2 C 6
3 D 8
4 E 9
5 F 5

#create second DataFrame
df2 = pd. DataFrame ({' team_name ': ['A', 'B', 'C', 'D', 'E', 'F'],
                    ' rebounds ': [12, 7, 8, 8, 5, 11]})

#view DataFrame
print (df2)

  team_name rebounds
0 to 12
1 B 7
2 C 8
3 D 8
4 E 5
5 F 11

Do wykonania złączenia wewnętrznego możemy użyć następującej składni, używając kolumny zespołu w pierwszej ramce danych i kolumny nazwa_zespołu w drugiej ramce danych:

 #merge DataFrames
df3 = pd. merge (df1, df2, left_on=' team ', right_on=' team_name ')

#view result
print (df3)

  team points team_name rebounds
0 A 4 A 12
1 B 4 B 7
2 C 6 C 8
3 D 8 D 8
4 E 9 E 5
5 F 5 F 11

Należy zauważyć, że jesteśmy w stanie pomyślnie wykonać złączenie wewnętrzne, mimo że nazwy dwóch kolumn użyte do złączenia były różne w każdej ramce danych.

Zauważ, że możemy również użyć poniższego kodu, aby usunąć kolumnę nazwa_zespołu z ostatecznie scalonej ramki danych, ponieważ wartości w tej kolumnie odpowiadają wartościom w kolumnie zespołu :

 #drop team_name column
df3. drop (' team_name ', axis= 1 , inplace= True )

#view updated DataFrame
print (df3)

  team points rebounds
0 to 4 12
1 B 4 7
2 C 6 8
3 D 8 8
4 E 9 5
5 F 5 11

Należy pamiętać, że kolumna nazwa_zespołu została usunięta z ramki DataFrame.

Powiązane: Jak usunąć kolumny w Pandach (4 przykłady)

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania związane z pandą:

Jak zmienić kolejność kolumn w Pandach
Jak zmienić nazwy kolumn w Pandach
Jak sortować kolumny według nazwy w Pandach

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *