Pandy: jak wybrać kolumny zawierające określony ciąg


Możesz użyć następujących metod, aby wybrać kolumny zawierające określony ciąg w ramce DataFrame pandy:

Metoda 1: Wybierz kolumny zawierające określony ciąg

 df. filter (regex=' string1 ')

Metoda 2: Wybierz kolumny zawierające jeden z kilku ciągów

 df. filter (regex=' string1|string2|string3 ')

Poniższe przykłady pokazują, jak w praktyce używać każdej z tych metod z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' mavs ': [10, 12, 14, 15, 19, 22, 27],
                   ' cavs ': [18, 22, 19, 14, 14, 11, 20],
                   ' hornets ': [5, 7, 7, 9, 12, 9, 14],
                   ' spurs ': [10, 12, 14, 13, 13, 19, 22],
                   ' net ': [10, 14, 25, 22, 25, 17, 12]})

#view DataFrame
print (df)

   mavs cavs hornets spurs nets
0 10 18 5 10 10
1 12 22 7 12 14
2 14 19 7 14 25
3 15 14 9 13 22
4 19 14 12 13 25
5 22 11 9 19 17
6 27 20 14 22 12

Przykład 1: Wybierz kolumny zawierające określony ciąg

Poniższy kod pokazuje, jak używać funkcji filter() do wybierania tylko kolumn zawierających w nazwie ciąg „avs”:

 #select columns that contain 'avs' in the name
df2 = df. filter (regex=' avs ')

#view DataFrame
print (df2)

   mavs cavs
0 10 18
1 12 22
2 14 19
3 15 14
4 19 14
5 22 11
6 27 20

Zwracane są tylko kolumny zawierające w nazwie „avs”.

W tym przypadku jedynymi zwracanymi kolumnami są „mavs” i „cavs”.

Przykład 2: Wybierz kolumny zawierające jeden z kilku ciągów

Poniższy kod pokazuje, jak używać funkcji filter() do wybierania tylko kolumn zawierających w nazwie „avs” lub „ets”:

 #select columns that contain 'avs' in the name
df2 = df. filter (regex=' avs|ets ')

#view DataFrame
print (df2)

   mavs cavs hornets nets
0 10 18 5 10
1 12 22 7 14
2 14 19 7 25
3 15 14 9 22
4 19 14 12 25
5 22 11 9 17
6 27 20 14 12

Zwracane są tylko kolumny zawierające w nazwie „avs” lub „ets”.

Zauważ, że pionowa kreska ( | ) to operator „ LUB ” w pandach.

Możesz dowolnie łączyć dowolną liczbę operatorów „OR”, aby wybrać kolumny zawierające jeden z wielu różnych ciągów.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak przenieść kolumnę przed ramkę DataFrame
Pandy: jak sprawdzić, czy kolumna zawiera ciąg znaków
Pandy: Jak dodać pustą kolumnę do DataFrame (3 przykłady)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *