Pandy: jak sprawdzić, czy w kolumnie istnieje wartość


Możesz użyć następujących metod, aby sprawdzić, czy konkretna wartość istnieje w kolumnie ramki DataFrame pandy:

Metoda 1: Sprawdź, czy w kolumnie znajduje się wartość

 22 in df[' my_column ']. values

Metoda 2: Sprawdź, czy w kolumnie istnieje którakolwiek z wielu wartości

 df[' my_column ']. isin ([44, 45, 22]). any ()

Poniższe przykłady pokazują, jak w praktyce używać każdej metody z następującą ramką DataFrame:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'],
                   ' points ': [18, 22, 19, 14, 14, 11, 20, 28],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})

#view DataFrame
print (df)

  team points assists rebounds
0 A 18 5 11
1 B 22 7 8
2 C 19 7 10
3 D 14 9 6
4 E 14 12 6
5 F 11 9 5
6 G 20 9 9
7:28 4 12

Przykład 1: Sprawdź, czy w kolumnie znajduje się wartość

Poniższy kod pokazuje, jak sprawdzić, czy w kolumnie punktów istnieje wartość 22 :

 #check if 22 exists in the 'points' column
22 in df[' points ']. values

True

Dane wyjściowe zwracają True , co oznacza, że w kolumnie punktów istnieje wartość 22 .

Możemy również użyć tej samej składni w przypadku kolumn łańcuchowych.

Na przykład poniższy kod pokazuje, jak sprawdzić, czy w kolumnie zespołu istnieje ciąg „J”:

 #check if 'J' exists in the 'team' column
'J' in df[' team ']. values

False

Dane wyjściowe zwracają False , co informuje nas, że ciąg „J” nie istnieje w kolumnie Zespół .

Przykład 2: Sprawdź, czy w kolumnie istnieje jedna z wielu wartości

Poniższy kod pokazuje jak sprawdzić czy w kolumnie punkty istnieje którakolwiek z wartości z listy [44, 45, 22]:

 #check if 44, 45 or 22 exist in the 'points' column
df[' points ']. isin ([44, 45, 22]). any ()

True

Dane wyjściowe zwracają True , co mówi nam, że co najmniej jedna z wartości z listy [44, 45, 22] istnieje w kolumnie punktów DataFrame.

Możemy również użyć tej samej składni w przypadku kolumn łańcuchowych.

Na przykład poniższy kod pokazuje, jak sprawdzić, czy w kolumnie zespołu istnieje ciąg z listy [’J’, 'K’, 'L’]:

 #check if J, K, or L exists in the 'team' column
df[' team ']. isin ([' J ',' K ',' L ']). any () 
False

Dane wyjściowe zwracają False , co oznacza, że żaden ciąg z listy nie istnieje w kolumnie zespołu .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje na pandach:

Jak usunąć wiersze w Pandas DataFrame na podstawie warunku
Jak filtrować ramkę danych Pandas pod wieloma warunkami
Jak korzystać z filtra „NIE W” w Pandas DataFrame

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *