Як запустити функцію countif у python
Часто ви можете підрахувати лише кількість рядків у pandas DataFrame, які відповідають певним критеріям.
На щастя, це легко зробити, використовуючи такий базовий синтаксис:
sum(df. column_name == some_value )
У наведених нижче прикладах показано, як використовувати цей синтаксис на практиці для такого кадру даних:
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})
#view head of DataFrame
df. head ()
x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9
Приклад 1: підрахувати рядки, які дорівнюють певному значенню
Наступний код показує, як підрахувати кількість рядків, у яких змінна x дорівнює 10:
sum( df.x == 10 ) 2
Наступний код показує, як підрахувати кількість рядків, у яких змінна x дорівнює 10 або змінна y дорівнює 5:
sum((df. x == 10 ) | (df. y == 5 )) 3
Наступний код показує, як підрахувати кількість рядків, у яких змінна x не дорівнює 10:
sum( df.x != 10 ) 9
Приклад 2: підрахунок рядків, більших або рівних певному значенню
Наступний код показує, як підрахувати кількість рядків, у яких x більше 10:
sum( df.x > 10 ) 2
Наступний код показує, як підрахувати кількість рядків, у яких x менше або дорівнює 7:
sum(df. x <= 7 ) 5
Приклад 3: підрахунок рядків між двома значеннями
У наведеному нижче коді показано, як підрахувати кількість рядків, у яких x становить від 10 до 20:
sum((df. x >= 5 ) & (df. x <= 10 )) 7
Додаткові ресурси
Панди: як знайти різницю між двома лініями
Pandas: як видалити рядки, що містять певний рядок
Pandas: як видалити дублікати рядків у DataFrame