"null이 아님"을 사용하는 방법은 무엇입니까? pandas에서(예제 포함)


pandas notnull() 함수를 사용하여 pandas DataFrame의 요소가 null인지 여부를 테스트할 수 있습니다.

요소가 NaN 또는 None과 같으면 함수는 False 를 반환합니다.

그렇지 않으면 함수는 True 를 반환합니다.

실제로 이 기능을 사용하는 몇 가지 일반적인 방법은 다음과 같습니다.

방법 1: 모든 열에 null 값이 없는 행 필터링

 df[df. notnull (). all ( 1 )]

방법 2: 특정 열에서 Null 값이 없는 행 필터링

 df[df[[' this_column ']]. notnull (). all ( 1 )]

방법 3: 각 열에서 0이 아닌 값의 개수 계산

 df. notnull (). sum ()

방법 4: 전체 DataFrame에서 0이 아닌 값의 개수 계산

 df. notnull (). sum (). sum ()

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, np.nan],
                   ' assists ': [5, np.nan, 7, 9, 12, 9, 9, np.nan],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, np.nan, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B 22.0 NaN 8.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 NaN
7 H NaN NaN 12.0

예시 1: 모든 열에 Null 값이 없는 행 필터링

다음 코드는 모든 열에 null 값이 없는 행만 표시하도록 DataFrame을 필터링하는 방법을 보여줍니다.

 #filter for rows with no null values in any column
df[df. notnull (). all ( 1 )]


        team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0

필터링된 DataFrame의 각 행에는 어떤 열에도 null 값이 없습니다.

예시 2: 특정 열에서 null 값이 없는 행 필터링

다음 코드는 DataFrame을 필터링하여 도우미 열에 null 값이 없는 행만 표시하는 방법을 보여줍니다.

 #filter for rows with no null values in the 'assists' column
df[df[[' assists ']]. notnull (). all ( 1 )]

	team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 7.0 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 NaN

필터링된 DataFrame의 각 행에는 Helper 열에 null 값이 없습니다.

예시 3: 각 열에서 0이 아닌 값의 개수 계산

다음 코드는 DataFrame의 각 열에서 0이 아닌 값의 개수를 계산하는 방법을 보여줍니다.

 #count number of non-null values in each column
df. notnull (). sum ()

team 8
points 7
assists 6
rebounds 7
dtype: int64

결과에서 우리는 다음을 볼 수 있습니다:

  • 열에는 0이 아닌 값이 8개 있습니다.
  • 포인트 열에는 0이 아닌 값이 7개 있습니다.
  • 지원 열에는 0이 아닌 값이 6개 있습니다.
  • 반송 열에는 0이 아닌 값이 7개 있습니다.

예시 4: 전체 DataFrame에서 0이 아닌 값의 개수 계산

다음 코드는 전체 DataFrame에서 0이 아닌 값의 개수를 계산하는 방법을 보여줍니다.

 #count number of non-null values in entire DataFrame
df. notnull (). sum (). sum ()

28

출력 결과를 보면 전체 DataFrame에 0이 아닌 값이 28개 있다는 것을 알 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 필터링 작업을 수행하는 방법을 설명합니다.

열 값으로 Pandas DataFrame을 필터링하는 방법
Pandas에서 ‘포함하지 않음’을 필터링하는 방법
여러 조건에서 Pandas DataFrame을 필터링하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다