Jak uruchomić funkcję countif w pythonie
Często możesz chcieć policzyć tylko liczbę wierszy w ramce danych pandy, która spełnia określone kryteria.
Na szczęście można to łatwo zrobić, korzystając z następującej podstawowej składni:
sum(df. column_name == some_value )
Poniższe przykłady pokazują, jak w praktyce zastosować tę składnię na następującej ramce danych:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df. head ()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Przykład 1: Policz wiersze o określonej wartości
Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których zmienna x jest równa 10:
sum( df.x == 10 ) 2
Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których zmienna x równa się 10 , a zmienna y równa się 5:
sum((df. x == 10 ) | (df. y == 5 )) 3
Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których zmienna x nie jest równa 10:
sum( df.x != 10 ) 9
Przykład 2: liczenie wierszy większych lub równych określonej wartości
Poniższy kod pokazuje, jak policzyć liczbę wierszy, w których x jest większe niż 10:
sum( df.x > 10 ) 2
Poniższy kod pokazuje, jak policzyć liczbę wierszy, gdzie x jest mniejsze lub równe 7:
sum(df. x <= 7 ) 5
Przykład 3: Zlicz linie pomiędzy dwiema wartościami
Poniższy kod pokazuje, jak policzyć liczbę wierszy, gdzie x mieści się w przedziale od 10 do 20:
sum((df. x >= 5 ) & (df. x <= 10 )) 7
Dodatkowe zasoby
Pandy: jak znaleźć różnicę między dwiema liniami
Pandy: jak usunąć linie zawierające określony ciąg
Pandy: Jak usunąć zduplikowane wiersze w ramce danych