Pandas: groupby를 사용하여 문자열을 연결하는 방법


다음 기본 구문을 사용하여 Pandas에서 GroupBy의 문자열을 연결할 수 있습니다.

 df. groupby ([' group_var '], as_index= False ). agg ({' string_var ': ' ' .join })

이 특정 수식은 group_var 열을 기준으로 행을 그룹화한 다음 string_var 열의 문자열을 연결합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: GroupBy를 사용하여 문자열을 연결하는 방법

다음과 같은 팬더 DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' store ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' quarter ': [1, 1, 2, 2, 1, 1, 2, 2],
                   ' employee ': ['Andy', 'Bob', 'Chad', 'Diane',
                                'Elana', 'Frank', 'George', 'Hank']})

#view DataFrame
print (df)

다음 구문을 사용하여 DataFrame의 행을 매장분기 별로 그룹화한 다음 직원 열의 문자열을 연결할 수 있습니다.

 #group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':''. join })

	store quarter employee
0 To 1 Andy Bob
1 A 2 Chad Diane
2 B 1 Elana Frank
3 B 2 George Hank

결과는 직원 열 문자열이 공백으로 연결된 매장분기 별로 그룹화된 DataFrame입니다.

& 기호와 같은 다른 구분 기호를 사용하여 문자열을 연결할 수도 있습니다.

 #group by store and quarter, then concatenate employee strings
df. groupby ([' store ', ' quarter '], as_index= False ). agg ({' employee ':' & '. join })

	store quarter employee
0 To 1 Andy & Bob
1 A 2 Chad & Diane
2 B 1 Elana & Frank
3 B 2 George & Hank

이제 직원 열의 문자열은 & 기호로 구분됩니다.

참고 : 여기 에서 pandas의 GroupBy 작업에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: 그룹당 누적 합계를 계산하는 방법
Pandas: 그룹별로 고유한 값을 계산하는 방법
Pandas: 그룹별 상관관계를 계산하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다