Pandas: 특정 열에 dropna()를 사용하는 방법


dropna() 함수를 subset 인수와 함께 사용하여 특정 열에 누락된 값이 포함된 pandas DataFrame의 행을 제거할 수 있습니다.

실제로 이 기능을 사용하는 가장 일반적인 방법은 다음과 같습니다.

방법 1: 특정 열에서 누락된 값이 있는 행 제거

 df. dropna (subset = [' column1 '], inplace= True )

방법 2: 여러 특정 열 중 하나에서 누락된 값이 있는 행 제거

 df. dropna (subset = [' column1 ', ' column2 ', ' column3 '], inplace= True )

다음 예에서는 다음 pandas DataFrame에서 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, np.nan, np.nan, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN NaN 8.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

예시 1: 특정 열에서 누락된 값이 있는 행 제거

다음 구문을 사용하여 “assistions” 열에서 누락된 값이 있는 행을 제거할 수 있습니다.

 #drop rows with missing values in 'assists' column
df. dropna (subset = [' assists '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

“Assists” 열에서 누락된 값이 있는 두 행이 모두 DataFrame에서 제거되었습니다.

또한 누락된 값이 “helps” 열에 없기 때문에 DataFrame의 마지막 행은 누락된 값이 있어도 유지됩니다.

예시 2: 여러 특정 열 중 하나에서 누락된 값이 있는 행 제거

다음 구문을 사용하여 “포인트” 또는 “반송” 열에서 누락된 값이 있는 행을 제거할 수 있습니다.

 #drop rows with missing values in 'points' or 'rebounds' column
df. dropna (subset = [' points ', ' rebounds '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0

“포인트” 또는 “바운스” 열에 누락된 값이 있는 두 행이 DataFrame에서 제거되었습니다.

참고 : pandas dropna() 함수에 대한 전체 문서는 여기에서 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 Pandas에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

Pandas: dropna()를 사용한 후 인덱스를 재설정하는 방법
Pandas: NaN 값이 있는 열을 제거하는 방법
Pandas: 여러 조건에 따라 행을 삭제하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다