Pandas: cara menggunakan dropna() dengan kolom tertentu


Anda dapat menggunakan fungsi dropna() dengan argumen subset untuk menghapus baris dari pandas DataFrame yang berisi nilai yang hilang di kolom tertentu.

Berikut adalah cara paling umum untuk menggunakan fitur ini dalam praktiknya:

Metode 1: Hapus baris dengan nilai yang hilang di kolom tertentu

 df. dropna (subset = [' column1 '], inplace= True )

Metode 2: Hapus baris dengan nilai yang hilang di salah satu dari beberapa kolom tertentu

 df. dropna (subset = [' column1 ', ' column2 ', ' column3 '], inplace= True )

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan pandas DataFrame berikut:

 import pandas as pd
import numpy as np

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, np.nan, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, np.nan, np.nan, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, np.nan]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
1 B NaN NaN 8.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

Contoh 1: Hapus baris dengan nilai yang hilang di kolom tertentu

Kita dapat menggunakan sintaks berikut untuk menghapus baris dengan nilai yang hilang di kolom “bantuan”:

 #drop rows with missing values in 'assists' column
df. dropna (subset = [' assists '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0
7H 28.0 4.0 NaN

Perhatikan bahwa dua baris dengan nilai yang hilang di kolom “Bantuan” keduanya telah dihapus dari DataFrame.

Perhatikan juga bahwa baris terakhir DataFrame dipertahankan meskipun ada nilai yang hilang karena nilai yang hilang tidak ada di kolom “bantuan”.

Contoh 2: Hapus baris dengan nilai yang hilang di salah satu dari beberapa kolom tertentu

Kita dapat menggunakan sintaks berikut untuk menghapus baris dengan nilai yang hilang di kolom “titik” atau “pentalan”:

 #drop rows with missing values in 'points' or 'rebounds' column
df. dropna (subset = [' points ', ' rebounds '], inplace= True )

#view updated DataFrame
print (df)

  team points assists rebounds
0 A 18.0 5.0 11.0
2 C 19.0 NaN 10.0
3D 14.0 9.0 6.0
4 E 14.0 12.0 6.0
5 F 11.0 9.0 5.0
6G 20.0 9.0 9.0

Perhatikan bahwa dua baris dengan nilai yang hilang di kolom “titik” atau “pentalan” telah dihapus dari DataFrame.

Catatan : Anda dapat menemukan dokumentasi lengkap untuk fungsi pandas dropna() di sini .

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di panda:

Pandas: Cara mereset indeks setelah menggunakan dropna()
Pandas: Cara menghapus kolom dengan nilai NaN
Pandas: Cara menghapus baris berdasarkan berbagai kondisi

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *