Pandas: cara menghapus baris yang berisi string tertentu


Anda dapat menggunakan sintaks berikut untuk menghapus baris yang berisi string tertentu di pandas DataFrame:

 df[df[" col "]. str . contains (" this string ") == False ]

Tutorial ini menjelaskan beberapa contoh penggunaan praktis sintaks ini dengan DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6
5 C East 5

Contoh 1: Hapus baris yang berisi string tertentu

Kode berikut menunjukkan cara menghapus semua baris dari DataFrame yang berisi “A” di kolom tim:

 df[df[" team "]. str . contains (" A ")== False ]

        team conference points
3 B West 6
4 B West 6
5 C East 5

Contoh 2: Hapus Baris yang Berisi String dalam Daftar

Kode berikut menunjukkan cara menghapus semua baris dari DataFrame yang berisi “A” atau “B” di kolom tim:

 df[df[" team "]. str . contains (" A|B ")== False ]

	team conference points
5 C East 5

Contoh 3: Hapus Baris yang Mengandung Sebagian String

Pada contoh sebelumnya, kita menghapus baris berdasarkan baris yang sama persis dengan satu atau lebih string.

Namun, jika kita ingin menghapus baris yang berisi sebagian string, kita dapat menggunakan sintaks berikut:

 #identify partial string to look for
discard = [" Wes "]

#drop rows that contain the partial string "Wes" in the conference column
df[~df. conference . str . contains (' | ' .join (discard))]

team conference points
0 A East 11
1 A East 8
2 A East 10
5 C East 5

Anda dapat menemukan tutorial panda lainnya di halaman ini .

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *