Pandas:문자열에 여러 하위 문자열이 포함되어 있는지 확인


다음 방법을 사용하여 Pandas DataFrame의 문자열에 여러 하위 문자열이 포함되어 있는지 확인할 수 있습니다.

방법 1: 문자열에 여러 하위 문자열 중 하나가 포함되어 있는지 확인

 df[' string_column ']. str . contains (' | ' .join ([' string1 ',' string2 ']))

방법 2: 문자열에 여러 하위 문자열이 포함되어 있는지 확인

 df[' string_column ']. str . contains ( r'^(?=.*string1)(?=.*string2)' )

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Good East Team', 'Good West Team', 'Great East Team',
                             'Great West Team', 'Bad East Team', 'Bad West Team'],
                   ' points ': [93, 99, 105, 110, 85, 88]})

#view DataFrame
print (df)

              team points
0 Good East Team 93
1 Good West Team 99
2 Great East Team 105
3 Great West Team 110
4 Bad East Team 85
5 Bad West Team 88

1: 문자열에 여러 하위 문자열 중 하나가 포함되어 있는지 확인

다음 구문을 사용하여 열의 각 문자열에 “Good” 또는 “Is” 하위 문자열이 포함되어 있는지 확인할 수 있습니다.

 #create new column that checks if each team name contains 'Good' or 'East'
df[' good_or_east '] = df[' team ']. str . contains (' | ' .join ([' Good ',' East ']))

#view updated DataFrame
print (df)

              team points good_or_east
0 Good East Team 93 True
1 Good West Team 99 True
2 Great East Team 105 True
3 Great West Team 110 False
4 Bad East Team 85 True
5 Bad West Team 88 False

새로운 good_or_east 열은 다음 값을 반환합니다.

  • 팀에 “좋음” 또는 “같음”이 포함되어 있으면 참입니다 .
  • 팀에 “좋음”이나 “같음”이 포함되어 있지 않으면 거짓입니다.

참고 : | 연산자는 팬더에서 “또는”을 의미합니다.

예시 2 : 문자열에 여러 하위 문자열이 포함되어 있는지 확인

다음 구문을 사용하여 열의 각 문자열에 “Good” “Is” 하위 문자열이 포함되어 있는지 확인할 수 있습니다.

 #create new column that checks if each team name contains 'Good' and 'East'
df[' good_and_east '] = df[' team ']. str . contains ( r'^(?=.*Good)(?=.*East)' )

#view updated DataFrame
print (df)

              team points good_and_east
0 Good East Team 93 True
1 Good West Team 99 False
2 Great East Team 105 False
3 Great West Team 110 False
4 Bad East Team 85 False
5 Bad West Team 88 False

새 열 good_and_east는 다음 값을 반환합니다.

  • 팀에 “좋음”과 “같음”이 포함되어 있으면 참입니다 .
  • 팀에 “좋음” 및 “같음”이 포함되어 있지 않으면 거짓입니다 .

“Good” 하위 문자열 “East” 하위 문자열을 포함하는 팀 이름이 하나뿐이므로 True 값은 하나만 반환됩니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: 한 DataFrame의 열을 다른 DataFrame에 추가
Pandas: 다른 DataFrame에 없는 행 가져오기
Pandas:여러 열이 같은지 확인하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다