Pandas: 빈 문자열을 nan으로 바꾸는 방법
다음 구문을 사용하여 팬더에서 빈 문자열을 NaN 값으로 바꿀 수 있습니다.
df = df. replace ( r'^\s*$' , np. nan , regex= True )
다음 예에서는 실제로 이 구문을 사용하는 방법을 보여줍니다.
관련 항목: Pandas에서 NaN 값을 문자열로 바꾸는 방법
예: 빈 문자열을 NaN으로 바꾸기
다양한 농구 선수에 대한 정보가 포함된 다음과 같은 pandas DataFrame이 있다고 가정합니다.
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', ' ', 'D', 'E', ' ', 'G', 'H'], ' position ': [' ', 'G', 'G', 'F', 'F', ' ', 'C', 'C'], ' points ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #view DataFrame df team position points rebounds 0 to 5 11 1 B G 7 8 2 G 7 10 3 D F 9 6 4 E F 12 6 5 9 5 6 G C 9 9 7 H C 4 12
팀 및 위치 열에는 빈 문자열이 여러 개 있습니다.
다음 구문을 사용하여 이러한 빈 문자열을 NaN 값으로 바꿀 수 있습니다.
import numpy as np
#replace empty values with NaN
df = df. replace ( r'^\s*$' , np. nan , regex= True )
#view updated DataFrame
df
team position points rebounds
0 A NaN 5 11
1 B G 7 8
2 NaN G 7 10
3 D F 9 6
4 E F 12 6
5 NaN NaN 9 5
6 G C 9 9
7 H C 4 127
각 빈 문자열은 NaN으로 대체되었습니다.
참고 : 여기 에서 pandas의 교체 기능에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
팬더에서 누락된 값을 대치하는 방법
팬더에서 누락된 값을 계산하는 방법
팬더에서 NaN 값을 평균으로 채우는 방법