Pandy: filtruj według kolumny, która nie jest równa określonym wartościom


Możesz użyć następujących metod, aby odfiltrować ramkę danych pandy, gdy kolumna nie jest równa określonym wartościom:

Metoda 1: Filtruj, gdy kolumna nie jest równa określonej wartości

 #filter rows where team column is not equal to 'Nets'
df_filtered = df[df[' team '] != ' Nets ']

Metoda 2: Filtruj, gdy kolumna nie jest równa kilku określonym wartościom

 #filter rows where team column is not equal to 'Nets', 'Mavs' or 'Kings'
df_filtered = df[ ~ df[' team ']. isin ([' Nets ', ' Mavs ', ' Kings '])]

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame pand:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['Mavs', 'Mavs', 'Nets', 'Nets', 'Heat', 'Heat', 'Kings'],
                   ' points ': [22, 28, 35, 34, 29, 28, 23]})

#view DataFrame
print (df)

    team points
0 Mavs 22
1 Mavs 28
2 Nets 35
3 Nets 34
4 Heat 29
5 Heat 28
6 Kings 23

Przykład 1: Filtr, w którym kolumna nie jest równa określonej wartości

Możemy użyć następującej składni, aby przefiltrować ramkę danych tak, aby zawierała tylko wiersze, w których kolumna zespołu nie jest równa „Sieci”:

 #filter rows where team column is not equal to 'Nets'
df_filtered = df[df[' team '] != ' Nets ']

#view filtered DataFrame
print (df_filtered)

    team points
0 Mavs 22
1 Mavs 28
4 Heat 29
5 Heat 28
6 Kings 23

Należy pamiętać, że każdy wiersz, w którym nazwa zespołu brzmiała „Nets”, został odfiltrowany z ramki DataFrame.

Uwaga : symbol != oznacza „nierówny” w pandach.

Przykład 2: Filtr, w którym kolumna nie jest równa kilku określonym wartościom

Możemy użyć następującej składni, aby przefiltrować ramkę danych tak, aby zawierała tylko wiersze, w których kolumna zespołu nie jest równa „Nets”, „Mavs” lub „Kings”:

 #filter rows where team column is not equal to 'Nets', 'Mavs' or 'Kings'
df_filtered = df[ ~ df[' team ']. isin ([' Nets ', ' Mavs ', ' Kings '])]

#view filtered DataFrame
print (df_filtered)

   team points
4 Heat 29
5 Heat 28

Należy pamiętać, że każdy wiersz, w którym nazwa zespołu brzmiała „Nets”, „Mavs” lub „Kings”, został odfiltrowany z ramki DataFrame.

Uwaga : symbol ~ oznacza „nie” u pand.

Dokumentacja : Pełną dokumentację funkcji pandy isin() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania związane z pandą:

Pandy: Jak dodać filtr do tabeli przestawnej
Pandy: jak filtrować „Nie zawiera”
Pandy: jak filtrować wiersze zawierające określony ciąg znaków

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *