Як поєднати два стовпці в pandas (з прикладами)
Ви можете використовувати такий синтаксис, щоб об’єднати два текстові стовпці в один у pandas DataFrame:
df[' new_column '] = df[' column1 '] + df[' column2 ']
Якщо один зі стовпців ще не є рядком, ви можете перетворити його за допомогою команди astype(str) :
df[' new_column '] = df[' column1 ']. astype ( str )+df[' column2 ']
І ви можете використовувати такий синтаксис, щоб об’єднати кілька текстових стовпців в один:
df[' new_column '] = df[[' col1 ', ' col2 ', ' col3 ', ...]]. agg (' '. join , axis= 1 )
Наведені нижче приклади показують, як на практиці об’єднати текстові стовпці.
Приклад 1: об’єднайте дві колонки
Наступний код показує, як об’єднати два текстові стовпці в один у pandas DataFrame:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #combine first and last name column into new column, with space in between df[' full_name '] = df[' first '] + ' ' + df[' last '] #view resulting dataFrame df team first last points full_name 0 Mavs Dirk Nowitzki 26 Dirk Nowitzki 1 Lakers Kobe Bryant 31 Kobe Bryant 2 Spurs Tim Duncan 22 Tim Duncan 3 Cavs LeBron James 29 LeBron James
Ми об’єднали стовпець імені та прізвища пробілом між ними, але ми також можемо використати інший роздільник, наприклад дефіс:
#combine first and last name column into new column, with dash in between df[' full_name '] = df[' first '] + ' - ' + df[' last '] #view resulting dataFrame df team first last points full_name 0 Mavs Dirk Nowitzki 26 Dirk - Nowitzki 1 Lakers Kobe Bryant 31 Kobe - Bryant 2 Spurs Tim Duncan 22 Tim - Duncan 3 Cavs Lebron James 29 Lebron - James
Приклад 2: Перетворення на текст і об’єднання двох стовпців
Наступний код показує, як перетворити стовпець на текст, а потім приєднати його до іншого стовпця:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #convert points to text, then join to last name column df[' name_points '] = df[' last '] + df[' points ']. astype ( str ) #view resulting dataFrame df team first last points name_points 0 Mavs Dirk Nowitzki 26 Nowitzki26 1 Lakers Kobe Bryant 31 Bryant31 2 Spurs Tim Duncan 22 Duncan22 3 Cavs LeBron James 29 James29
Приклад 3: об’єднайте більше двох стовпців
Наступний код показує, як об’єднати кілька стовпців в один:
import pandas as pd #create dataFrame df = pd. DataFrame ({' team ': ['Mavs', 'Lakers', 'Spurs', 'Cavs'], ' first ': ['Dirk', 'Kobe', 'Tim', 'Lebron'], ' last ': ['Nowitzki', 'Bryant', 'Duncan', 'James'], ' points ': [26, 31, 22, 29]}) #join team, first name, and last name into one column df[' team_and_name '] = df[[' team ', ' first ', ' last ']]. agg (' '. join , axis= 1 ) #view resulting dataFrame df team first last points team_name 0 Mavs Dirk Nowitzki 26 Mavs Dirk Nowitzki 1 Lakers Kobe Bryant 31 Lakers Kobe Bryant 2 Spurs Tim Duncan 22 Spurs Tim Duncan 3 Cavs Lebron James 29 Cavs Lebron James
Додаткові ресурси
Панди: як знайти різницю між двома колонками
Панди: як знайти різницю між двома лініями
Pandas: як сортувати стовпці за назвою