Jak uruchomić funkcję countif w pythonie


Często możesz chcieć policzyć tylko liczbę wierszy w ramce danych pandy, która spełnia określone kryteria.

Na szczęście można to łatwo zrobić, korzystając z następującej podstawowej składni:

 sum(df. column_name == some_value )

Poniższe przykłady pokazują, jak w praktyce zastosować tę składnię na następującej ramce danych:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
                   ' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})

#view head of DataFrame
df. head ()

x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9

Przykład 1: Policz wiersze o określonej wartości

Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których zmienna x jest równa 10:

 sum( df.x == 10 )

2

Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których zmienna x równa się 10 , a zmienna y równa się 5:

 sum((df. x == 10 ) | (df. y == 5 ))

3

Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których zmienna x nie jest równa 10:

 sum( df.x != 10 )

9

Przykład 2: liczenie wierszy większych lub równych określonej wartości

Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których x jest większe niż 10:

 sum( df.x > 10 ) 

2

Poniższy kod pokazuje, jak policzyć liczbę wierszy, gdzie x jest mniejsze lub równe 7:

 sum(df. x <= 7 )
 
5

Przykład 3: Zlicz linie pomiędzy dwiema wartościami

Poniższy kod pokazuje, jak policzyć liczbę wierszy, gdzie x mieści się w przedziale od 10 do 20:

 sum((df. x >= 5 ) & (df. x <= 10 ))

7

Dodatkowe zasoby

Pandy: jak znaleźć różnicę między dwiema liniami
Pandy: jak usunąć linie zawierające określony ciąg
Pandy: Jak usunąć zduplikowane wiersze w ramce danych

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *