Pandas: 문자열에서 특정 문자를 제거하는 방법


다음 방법을 사용하여 Pandas DataFrame 열의 문자열에서 특정 문자를 제거할 수 있습니다.

방법 1: 문자열에서 특정 문자 제거

 df[' my_column '] = df[' my_column ']. str . replace (' this_string ', '')

방법 2: 문자열에서 모든 문자 제거

 df[' my_column '] = df[' my_column ']. str . replace (' \D ', '', regex= True )

방법 3: 문자열에서 모든 숫자 제거

 df[' my_column '] = df[' my_column ']. str . replace (' \d+ ', '', regex= True )

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs2', 'Nets44', 'Kings33', 'Cavs90', 'Heat576'],
                   ' points ': [12, 15, 22, 29, 24]})

#view DataFrame
print (df)

      team points
0 Mavs2 12
1 Nets44 15
2 Kings33 22
3 Cavs90 29
4 Heat576 24

예시 1: 문자열에서 특정 문자 제거

다음 구문을 사용하여 열의 각 문자열에서 “avs”를 제거할 수 있습니다.

 #remove 'avs' from strings in team column
df[' team '] = df[' team ']. str . replace (' avs ', '')

#view updated DataFrame
print (df)

      team points
0 M2 12
1 Nets44 15
2 Kings33 22
3 C90 29
4 Heat576 24

열에 “Mavs” 및 “Cavs”가 포함된 행에서 “avs”가 제거되었습니다.

예시 2: 문자열에서 모든 문자 제거

다음 구문을 사용하여 열의 각 문자열에서 모든 문자를 제거할 수 있습니다.

 #remove letters from strings in team column
df[' team '] = df[' team ']. str . replace (' \D ', '', regex= True )

#view updated DataFrame
print (df)

  team points
0 2 12
1 44 15
2 33 22
3 90 29
4,576 24

열의 각 문자열에서 모든 문자가 제거되었습니다.

수치만 남습니다.

예시 3: 문자열에서 모든 숫자 제거

다음 구문을 사용하여 열의 각 문자열에서 모든 숫자를 제거할 수 있습니다.

 #remove numbers from strings in team column
df[' team '] = df[' team ']. str . replace (' \d+ ', '', regex= True )

#view updated DataFrame
print (df)

    team points
0 Mavs 12
1 Nets 15
2 Kings 22
3 Cavs 29
4 Heat 24

열의 각 문자열에서 모든 숫자가 제거되었습니다.

글자만 남았습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas에서 NaN 값을 0으로 바꾸는 방법
Pandas에서 빈 문자열을 NaN으로 바꾸는 방법
Pandas의 조건에 따라 열의 값을 바꾸는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다