Pandas: 열에서 특수 문자를 제거하는 방법


다음 기본 구문을 사용하여 Pandas DataFrame의 열에서 특수 문자를 제거할 수 있습니다.

 df[' my_column '] = df[' my_column ']. str . replace (' \W ', '', regex= True )

이 특정 예는 문자나 숫자가 아닌 my_column 의 모든 문자를 제거합니다.

다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.

예: Pandas의 열에서 특수 문자 제거

다양한 농구 선수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs$', 'Nets', 'Kings!!', 'Spurs%', '&Heat&'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs$ 12
1 Nets 15
2 Kings!! 22
3 Spurs% 29
4 &Heat& 24

열 값에서 모든 특수 문자를 제거한다고 가정해 보겠습니다.

이를 위해 다음 구문을 사용할 수 있습니다.

 #remove special characters from team column
df[' team '] = df[' team ']. str . replace (' \W ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Spurs 29
4 Heat 24

열 값에서 모든 특수 문자가 제거되었습니다.

참고 : 정규식 \W는 단어가 아닌 모든 문자, 즉 알파벳이나 숫자가 아닌 문자를 검색하는 데 사용됩니다.

이 예에서는 단어가 아닌 문자를 각각 빈 값으로 바꾸었습니다. 이는 단어가 아닌 문자를 제거하는 것과 같습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 NaN 값을 0으로 바꾸는 방법
Pandas에서 빈 문자열을 NaN으로 바꾸는 방법
Pandas의 조건에 따라 열의 값을 바꾸는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다