Pandas: 열에서 특수 문자를 제거하는 방법
다음 기본 구문을 사용하여 Pandas DataFrame의 열에서 특수 문자를 제거할 수 있습니다.
df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )
이 특정 예는 문자나 숫자가 아닌 my_column 의 모든 문자를 제거합니다.
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
예: Pandas의 열에서 특수 문자 제거
다양한 농구 선수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'], ' points ': [12, 15, 22, 29, 24]}) #view DataFrame print (df) team points 0 Mavs$ 12 1 Nets 15 2 Kings!! 22 3 Spurs% 29 4 &Heat& 24
팀 열 값에서 모든 특수 문자를 제거한다고 가정해 보겠습니다.
이를 위해 다음 구문을 사용할 수 있습니다.
#remove special characters from team column df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True ) #view updated DataFrame print (df) team points 0 Mavs 12 1 Nets 15 2 Kings 22 3 Spurs 29 4 Heat 24
팀 열 값에서 모든 특수 문자가 제거되었습니다.
참고 : 정규식 \W는 단어가 아닌 모든 문자, 즉 알파벳이나 숫자가 아닌 문자를 검색하는 데 사용됩니다.
이 예에서는 단어가 아닌 문자를 각각 빈 값으로 바꾸었습니다. 이는 단어가 아닌 문자를 제거하는 것과 같습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 NaN 값을 0으로 바꾸는 방법
Pandas에서 빈 문자열을 NaN으로 바꾸는 방법
Pandas의 조건에 따라 열의 값을 바꾸는 방법