Pandas: 문자열에서 특정 문자를 제거하는 방법
다음 방법을 사용하여 Pandas DataFrame 열의 문자열에서 특정 문자를 제거할 수 있습니다.
방법 1: 문자열에서 특정 문자 제거
df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')
방법 2: 문자열에서 모든 문자 제거
df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )
방법 3: 문자열에서 모든 숫자 제거
df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )
다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs2 12 1 Nets44 15 2 Kings33 22 3 Cavs90 29 4 Heat576 24
예시 1: 문자열에서 특정 문자 제거
다음 구문을 사용하여 팀 열의 각 문자열에서 “avs”를 제거할 수 있습니다.
#remove 'avs' from strings in team column df[' team '] = df[' team ']. str . replace (' avs ', '') #view updated DataFrame print (df) team points 0 M2 12 1 Nets44 15 2 Kings33 22 3 C90 29 4 Heat576 24
팀 열에 “Mavs” 및 “Cavs”가 포함된 행에서 “avs”가 제거되었습니다.
예시 2: 문자열에서 모든 문자 제거
다음 구문을 사용하여 팀 열의 각 문자열에서 모든 문자를 제거할 수 있습니다.
#remove letters from strings in team column df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True ) #view updated DataFrame print (df) team points 0 2 12 1 44 15 2 33 22 3 90 29 4,576 24
팀 열의 각 문자열에서 모든 문자가 제거되었습니다.
수치만 남습니다.
예시 3: 문자열에서 모든 숫자 제거
다음 구문을 사용하여 팀 열의 각 문자열에서 모든 숫자를 제거할 수 있습니다.
#remove numbers from strings in team column df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Cavs 29 4 Heat 24
팀 열의 각 문자열에서 모든 숫자가 제거되었습니다.
글자만 남았습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 NaN 값을 0으로 바꾸는 방법
Pandas에서 빈 문자열을 NaN으로 바꾸는 방법
Pandas의 조건에 따라 열의 값을 바꾸는 방법