Pandy: jak używać metody isin() z metodą query().


Często możesz chcieć użyć funkcji isin() w metodzie query() w pandach, aby filtrować wiersze w ramce DataFrame, w której kolumna zawiera wartość na liście.

Aby to zrobić, możesz użyć następującej składni:

 df. query (' team in ["A", "B", "D"] ')

To konkretne zapytanie filtruje wiersze z ramki danych pandy, w której kolumna zespołu ma wartość A, B lub D.

Uwaga : podczas korzystania z metody query() pandy musimy użyć in zamiast isin .

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Użyj metody query() do filtrowania wartości na liście

Załóżmy, że mamy następującą ramkę danych pand, która zawiera informacje o różnych koszykarzach:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'E'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
4 C 14 12 6
5 C 11 9 5
6 D 20 9 9
7 E 28 4 12

Załóżmy teraz, że chcemy znaleźć wiersze, w których wartość w kolumnie zespołu jest równa A, B lub D.

W tym celu możemy użyć następującej składni:

 #query for rows where team is in list of specific teams
df. query (' team in ["A", "B", "D"] ')

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 9

Należy pamiętać, że funkcja query() zwraca wszystkie wiersze, w których wartość w kolumnie zespołu jest równa A, B lub D.

Należy również pamiętać, że możemy przechowywać listę nazw zespołów w zmiennej, a następnie odwoływać się do zmiennej w funkcji query() za pomocą operatora @ :

 #create variable to hold specific team names
team_names = [" A ", " B ", " D "]

#query for rows where team is equal to a team name in team_names variable
df. query (' team in @team_names ')

	team points assists rebounds
0 A 18 5 11
1 to 22 7 8
2 B 19 7 10
3 B 14 9 6
6 D 20 9 92

Zapytanie zwraca wszystkie wiersze w ramce danych, gdzie zespół jest równy jednej z nazw zespołów przechowywanych w zmiennej team_names .

Należy pamiętać, że wyniki tego zapytania są zgodne z wynikami poprzedniego przykładu.

Uwaga : pełną dokumentację funkcji query() pandy można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w pandach:

Pandy: Jak filtrować wiersze na podstawie długości łańcucha
Pandy: Jak usuwać wiersze na podstawie warunku
Pandy: Jak korzystać z filtra „NO IN”.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *