"null이 아님"을 사용하는 방법은 무엇입니까? pandas에서(예제 포함)
pandas notnull() 함수를 사용하여 pandas DataFrame의 요소가 null인지 여부를 테스트할 수 있습니다.
요소가 NaN 또는 None과 같으면 함수는 False 를 반환합니다.
그렇지 않으면 함수는 True 를 반환합니다.
실제로 이 기능을 사용하는 몇 가지 일반적인 방법은 다음과 같습니다.
방법 1: 모든 열에 null 값이 없는 행 필터링
df[df. notnull (). all ( 1 )]
방법 2: 특정 열에서 Null 값이 없는 행 필터링
df[df[[' this_column ']]. notnull (). all ( 1 )]
방법 3: 각 열에서 0이 아닌 값의 개수 계산
df. notnull (). sum ()
방법 4: 전체 DataFrame에서 0이 아닌 값의 개수 계산
df. notnull (). sum (). sum ()
다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.
import pandas as pd import numpy as np #createDataFrame df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'], ' points ': [18, 22, 19, 14, 14, 11, 20, np.nan], ' assists ': [5, np.nan, 7, 9, 12, 9, 9, np.nan], ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]}) #view DataFrame print (df) team points assists rebounds 0 A 18.0 5.0 11.0 1 B 22.0 NaN 8.0 2 C 19.0 7.0 10.0 3D 14.0 9.0 6.0 4 E 14.0 12.0 6.0 5 F 11.0 9.0 5.0 6G 20.0 9.0 NaN 7 H NaN NaN 12.0
예시 1: 모든 열에 Null 값이 없는 행 필터링
다음 코드는 모든 열에 null 값이 없는 행만 표시하도록 DataFrame을 필터링하는 방법을 보여줍니다.
#filter for rows with no null values in any column
df[df. notnull (). all ( 1 )]
team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
필터링된 DataFrame의 각 행에는 어떤 열에도 null 값이 없습니다.
예시 2: 특정 열에서 null 값이 없는 행 필터링
다음 코드는 DataFrame을 필터링하여 도우미 열에 null 값이 없는 행만 표시하는 방법을 보여줍니다.
#filter for rows with no null values in the 'assists' column
df[df[[' assists ']]. notnull (). all ( 1 )]
team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 NaN
필터링된 DataFrame의 각 행에는 Helper 열에 null 값이 없습니다.
예시 3: 각 열에서 0이 아닌 값의 개수 계산
다음 코드는 DataFrame의 각 열에서 0이 아닌 값의 개수를 계산하는 방법을 보여줍니다.
#count number of non-null values in each column
df. notnull (). sum ()
team 8
points 7
assists 6
rebounds 7
dtype: int64
결과에서 우리는 다음을 볼 수 있습니다:
- 팀 열에는 0이 아닌 값이 8개 있습니다.
- 포인트 열에는 0이 아닌 값이 7개 있습니다.
- 지원 열에는 0이 아닌 값이 6개 있습니다.
- 반송 열에는 0이 아닌 값이 7개 있습니다.
예시 4: 전체 DataFrame에서 0이 아닌 값의 개수 계산
다음 코드는 전체 DataFrame에서 0이 아닌 값의 개수를 계산하는 방법을 보여줍니다.
#count number of non-null values in entire DataFrame
df. notnull (). sum (). sum ()
28
출력 결과를 보면 전체 DataFrame에 0이 아닌 값이 28개 있다는 것을 알 수 있습니다.
추가 리소스
다음 튜토리얼에서는 Pandas에서 다른 일반적인 필터링 작업을 수행하는 방법을 설명합니다.
열 값으로 Pandas DataFrame을 필터링하는 방법
Pandas에서 ‘포함하지 않음’을 필터링하는 방법
여러 조건에서 Pandas DataFrame을 필터링하는 방법