Pandas: nan 값이 있는 열을 제거하는 방법
다음 방법을 사용하여 NaN 값이 있는 Pandas DataFrame에서 열을 제거할 수 있습니다.
방법 1: NaN 값이 있는 열 제거
df = df. dropna (axis= 1 )
방법 2: NaN 값이 모두 포함된 열 제거
df = df. dropna (axis= 1 ,how=' all ')
방법 3: 최소 개수의 NaN 값이 있는 열 제거
df = df. dropna (axis= 1 ,thresh= 2 )
다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B'], ' position ': [np.nan, 'G', 'F', 'F', 'C', 'G'], ' points ': [11, 28, 10, 26, 6, 25], ' rebounds ': [np.nan, np.nan, np.nan, np.nan, np.nan, np.nan]}) #view DataFrame print (df) team position points rebounds 0 A NaN 11 NaN 1 AG 28 NaN 2 AF 10 NaN 3 BF 26 NaN 4 BC 6 NaN 5 BG 25 NaN
예 1: NaN 값이 있는 열 제거
다음 코드는 NaN 값이 있는 열을 제거하는 방법을 보여줍니다.
#drop columns with any NaN values df = df. dropna (axis= 1 ) #view updated DataFrame print (df) team points 0 to 11 1 to 28 2 to 10 3 B 26 4 B 6 5 B 25
위치 및 리바운드 열은 둘 다 하나 이상의 NaN 값을 갖고 있으므로 제거되었습니다.
예시 2: 모든 NaN 값이 포함된 열 제거
다음 코드는 모든 NaN 값이 포함된 열을 제거하는 방법을 보여줍니다.
#drop columns with all NaN values df = df. dropna (axis= 1 ,how=' all ') #view updated DataFrame print (df) team position points 0 A NaN 11 1 AG 28 2 AF10 3 BF 26 4 BC 6 5 BG 25
반송 열은 모든 NaN 값이 포함된 유일한 열이었기 때문에 제거되었습니다.
예 3: 최소 개수의 NaN 값이 있는 열 제거
다음 코드는 두 개 이상의 NaN 값이 있는 열을 제거하는 방법을 보여줍니다.
#drop columns with at least two NaN values df = df. dropna (axis= 1 ,thresh= 2 ) #view updated DataFrame print (df) team position points 0 A NaN 11 1 AG 28 2 AF10 3 BF 26 4 BC 6 5 BG 25
반송 열은 NaN 값이 두 개 이상 있는 유일한 열이었기 때문에 제거되었습니다.
참고 : 여기에서 pandas의 dropna() 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
Pandas에서 첫 번째 열을 제거하는 방법
Pandas에서 중복 열을 제거하는 방법
Pandas에서 일부 열을 제외한 모든 열을 삭제하는 방법