Pandas: cara memilih kolom berdasarkan kecocokan sebagian
Anda dapat menggunakan metode berikut untuk memilih kolom di pandas DataFrame berdasarkan kecocokan sebagian:
Metode 1: Pilih kolom berdasarkan kecocokan sebagian
#select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]
Metode 2: Pilih kolom berdasarkan beberapa kecocokan parsial
#select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]
Contoh berikut menunjukkan cara menggunakan setiap metode dengan pandas DataFrame berikut:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'], ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4], ' assists ': [11, 8, 10, 6, 6, 5, 9, 12], ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]}) #view DataFrame print (df) team_name team_points assists rebounds 0 A 5 11 6 1 To 7 8 7 2 To 7 10 7 3 to 9 6 6 4 B 12 6 10 5 B 9 5 12 6 B 9 9 10 7 B 4 12 9
Contoh 1: Pilih kolom berdasarkan kecocokan sebagian
Kode berikut menunjukkan cara memilih semua kolom di pandas DataFrame yang berisi “tim” di nama kolom:
#select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]
#view results
print (df_team_cols)
team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4
Perhatikan bahwa kedua kolom dengan nama “tim” dikembalikan.
Contoh 2: Pilih kolom berdasarkan beberapa kecocokan parsial
Kode berikut menunjukkan cara memilih semua kolom di pandas DataFrame yang berisi “tim” atau “pentalan” di nama kolom:
#select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]
#view results
print (df_team_rebs)
team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9
Semua kolom dengan nama “tim” atau “rebound” dikembalikan.
Catatan : | operator mewakili “ATAU” di panda.
Jangan ragu untuk menggunakan operator ini sebanyak yang Anda inginkan untuk menemukan kecocokan string parsial sebanyak yang Anda inginkan.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:
Cara memilih kolom berdasarkan nama di Pandas
Cara memilih kolom berdasarkan indeks di Pandas
Cara memilih kolom berdasarkan tipe data di Pandas