Jak filtrować ramkę danych pandas pod wieloma warunkami


Często możesz chcieć przefiltrować ramkę danych pand pod wieloma warunkami. Na szczęście można to łatwo zrobić za pomocą operacji logicznych.

W tym samouczku przedstawiono kilka przykładów filtrowania następującej ramki DataFrame pand pod kilkoma warunkami:

 import pandas as pd

#createDataFrame
df = pd.DataFrame({'team': ['A', 'A', 'B', 'B', 'C'],
                   'points': [25, 12, 15, 14, 19],
                   'assists': [5, 7, 7, 9, 12],
                   'rebounds': [11, 8, 10, 6, 6]})

#view DataFrame 
df

        team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6
4 C 19 12 6

Przykład 1: Filtruj według wielu warunków za pomocą „I”

Poniższy kod ilustruje sposób filtrowania ramki danych za pomocą operatora i ( & ):

 #return only rows where points is greater than 13 and assists is greater than 7
df[(df. points > 13) & (df. assists > 7)]

        team points assists rebounds
3 B 14 9 6
4 C 19 12 6

#return only rows where team is 'A' and points is greater than or equal to 15
df[(df. team == 'A') & (df. points >= 15)]


        team points assists rebounds
0 to 25 5 11

Przykład 2: Filtruj według wielu warunków za pomocą „Or”

Poniższy kod ilustruje sposób filtrowania ramki danych przy użyciu operatora lub ( | ):

 #return only rows where points is greater than 13 or assists is greater than 7
df[(df. dots > 13) | (df. assists > 7)]


        team points assists rebounds
0 to 25 5 11
2 B 15 7 10
3 B 14 9 6
4 C 19 12 6

#return only rows where team is 'A' or points is greater than or equal to 15
df[( df.team == 'A') | (df. points >= 15)]

        team points assists rebounds
0 to 25 5 11
1 to 12 7 8
2 B 15 7 10
4 C 19 12 6

Przykład 3: Filtruj według wielu warunków za pomocą listy

Poniższy kod demonstruje sposób filtrowania DataFrame, w którym na liście znajdują się wartości wierszy.

 #define a list of values
filter_list = [12, 14, 15]

#return only rows where points is in the list of values
df[df. points . isin (filter_list)]

	team points assists rebounds
1 to 12 7 8
2 B 15 7 10
3 B 14 9 6

#define another list of values
filter_list2 = ['A', 'C']

#return only rows where team is in the list of values
df[df. team . isin (filter_list2)]


        team points assists rebounds
0 to 25 5 11
1 to 12 7 8
4 C 19 12 6

Więcej tutoriali o pandach znajdziesz tutaj .

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *