Pandas: cara menggabungkan string menggunakan groupby


Anda dapat menggunakan sintaks dasar berikut untuk menggabungkan string dari GroupBy di panda:

 df. groupby ([' group_var '], as_index= False ). agg ({' string_var ': ' ' .join })

Rumus khusus ini mengelompokkan baris berdasarkan kolom group_var , lalu menggabungkan string di kolom string_var .

Contoh berikut menunjukkan cara menggunakan sintaksis ini dalam praktiknya.

Contoh: Cara menggabungkan string menggunakan GroupBy

Misalkan kita memiliki panda DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' quarter ': [1, 1, 2, 2, 1, 1, 2, 2],
                   ' employee ': ['Andy', 'Bob', 'Chad', 'Diane',
                                'Elana', 'Frank', 'George', 'Hank']})

#view DataFrame
print (df)

Kita dapat menggunakan sintaks berikut untuk mengelompokkan baris DataFrame berdasarkan penyimpanan dan kuartal , lalu menggabungkan string di kolom karyawan :

 #group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':''. join })

	store quarter employee
0 To 1 Andy Bob
1 A 2 Chad Diane
2 B 1 Elana Frank
3 B 2 George Hank

Hasilnya adalah DataFrame yang dikelompokkan berdasarkan toko dan kuartal dengan string kolom karyawan digabungkan dengan spasi.

Kita juga dapat menggabungkan string menggunakan pemisah yang berbeda seperti simbol & :

 #group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':' & '. join })

	store quarter employee
0 To 1 Andy & Bob
1 A 2 Chad & Diane
2 B 1 Elana & Frank
3 B 2 George & Hank

Perhatikan bahwa string di kolom karyawan sekarang dipisahkan dengan simbol & .

Catatan : Anda dapat menemukan dokumentasi lengkap operasi GroupBy di pandas di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Pandas: cara menghitung jumlah kumulatif per kelompok
Pandas: cara menghitung nilai unik berdasarkan kelompok
Pandas: cara menghitung korelasi berdasarkan kelompok

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *