Pandas: cara memeriksa apakah kolom berisi string


Anda dapat menggunakan metode berikut untuk memeriksa apakah kolom pandas DataFrame berisi string:

Metode 1: Periksa apakah ada string yang tepat di kolom

 (df[' col ']. eq (' exact_string ')). any ()

Metode 2: Periksa apakah ada sebagian string di kolom

 df[' col ']. str . contains (' partial_string '). any ()

Metode 3: Hitung kemunculan sebagian string di kolom

 df[' col ']. str . contains (' partial_string '). sum ()

Tutorial ini menjelaskan cara menggunakan setiap metode dalam praktik dengan DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'South', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A South 10
3 B West 6
4 B West 6
5 C East 5

Contoh 1: Periksa apakah ada string yang tepat di kolom

Kode berikut menunjukkan cara memeriksa apakah string “Eas” yang tepat ada di kolom konferensi DataFrame:

 #check if exact string 'Eas' exists in conference column
(df[' conference ']. eq (' Eas ')). any ()

False

Outputnya mengembalikan False , yang memberi tahu kita bahwa string “Eas” yang sebenarnya tidak ada di kolom konferensi DataFrame.

Contoh 2: Periksa apakah ada sebagian string di kolom

Kode berikut menunjukkan cara memeriksa apakah string parsial “Eas” ada di kolom konferensi DataFrame:

 #check if partial string 'Eas' exists in conference column
df[' conference ']. str . contains (' Eas '). any ()

True

Outputnya mengembalikan True , yang memberi tahu kita bahwa sebagian string “Eas” ada di kolom konferensi DataFrame.

Contoh 3: Menghitung kemunculan sebagian string dalam kolom

Kode berikut menunjukkan cara menghitung berapa kali string parsial “Eas” muncul di kolom konferensi DataFrame:

 #count occurrences of partial string 'Eas' in conference column
df[' conference ']. str . contains (' East '). sum ()

3

Outputnya mengembalikan 3 , yang memberi tahu kita bahwa string parsial ‘Eas’ muncul 3 kali di kolom konferensi DataFrame.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Cara menghapus baris di Pandas DataFrame berdasarkan kondisi
Cara memfilter Pandas DataFrame pada berbagai kondisi
Cara menggunakan filter “TIDAK DALAM” di Pandas DataFrame

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *