Pandas: cara memilih kolom berdasarkan kecocokan sebagian


Anda dapat menggunakan metode berikut untuk memilih kolom di pandas DataFrame berdasarkan kecocokan sebagian:

Metode 1: Pilih kolom berdasarkan kecocokan sebagian

 #select columns that contain 'team'
df. loc [:, df. columns . str . contains (' team ')]

Metode 2: Pilih kolom berdasarkan beberapa kecocokan parsial

 #select columns that contain 'team' or 'rebounds'
df. loc [:, df. columns . str . contains (' team|rebounds ')]

Contoh berikut menunjukkan cara menggunakan setiap metode dengan pandas DataFrame berikut:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team_name ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' team_points ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' assists ': [11, 8, 10, 6, 6, 5, 9, 12],
                   ' rebounds ': [6, 7, 7, 6, 10, 12, 10, 9]})

#view DataFrame
print (df)

  team_name team_points assists rebounds
0 A 5 11 6
1 To 7 8 7
2 To 7 10 7
3 to 9 6 6
4 B 12 6 10
5 B 9 5 12
6 B 9 9 10
7 B 4 12 9

Contoh 1: Pilih kolom berdasarkan kecocokan sebagian

Kode berikut menunjukkan cara memilih semua kolom di pandas DataFrame yang berisi “tim” di nama kolom:

 #select columns that contain 'team'
df_team_cols = df. loc [:, df. columns . str . contains (' team ')]

#view results
print (df_team_cols)

  team_name team_points
0 to 5
1 to 7
2 to 7
3 to 9
4 B 12
5 B 9
6 B 9
7 B 4

Perhatikan bahwa kedua kolom dengan nama “tim” dikembalikan.

Contoh 2: Pilih kolom berdasarkan beberapa kecocokan parsial

Kode berikut menunjukkan cara memilih semua kolom di pandas DataFrame yang berisi “tim” atau “pentalan” di nama kolom:

 #select columns that contain 'team' or 'rebounds'
df_team_rebs = df. loc [:, df. columns . str . contains (' team|rebounds ')]

#view results
print (df_team_rebs)

  team_name team_points rebounds
0 to 5 6
1 To 7 7
2 to 7 7
3 to 9 6
4 B 12 10
5 B 9 12
6 B 9 10
7 B 4 9

Semua kolom dengan nama “tim” atau “rebound” dikembalikan.

Catatan : | operator mewakili “ATAU” di panda.

Jangan ragu untuk menggunakan operator ini sebanyak yang Anda inginkan untuk menemukan kecocokan string parsial sebanyak yang Anda inginkan.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan operasi umum lainnya di panda:

Cara memilih kolom berdasarkan nama di Pandas
Cara memilih kolom berdasarkan indeks di Pandas
Cara memilih kolom berdasarkan tipe data di Pandas

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *