Як запустити функцію countif у python


Часто ви можете підрахувати лише кількість рядків у pandas DataFrame, які відповідають певним критеріям.

На щастя, це легко зробити, використовуючи такий базовий синтаксис:

 sum(df. column_name == some_value )

У наведених нижче прикладах показано, як використовувати цей синтаксис на практиці для такого кадру даних:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' x ': [3, 4, 5, 6, 7, 8, 9, 10, 10, 12, 13],
                   ' y ': [3, 4, 5, 7, 9, 13, 15, 19, 23, 24, 29]})

#view head of DataFrame
df. head ()

x y
0 3 3
1 4 4
2 5 5
3 6 7
4 7 9

Приклад 1: підрахувати рядки, які дорівнюють певному значенню

Наступний код показує, як підрахувати кількість рядків, у яких змінна x дорівнює 10:

 sum( df.x == 10 )

2

Наступний код показує, як підрахувати кількість рядків, у яких змінна x дорівнює 10 або змінна y дорівнює 5:

 sum((df. x == 10 ) | (df. y == 5 ))

3

Наступний код показує, як підрахувати кількість рядків, у яких змінна x не дорівнює 10:

 sum( df.x != 10 )

9

Приклад 2: підрахунок рядків, більших або рівних певному значенню

Наступний код показує, як підрахувати кількість рядків, у яких x більше 10:

 sum( df.x > 10 ) 

2

Наступний код показує, як підрахувати кількість рядків, у яких x менше або дорівнює 7:

 sum(df. x <= 7 )
 
5

Приклад 3: підрахунок рядків між двома значеннями

У наведеному нижче коді показано, як підрахувати кількість рядків, у яких x становить від 10 до 20:

 sum((df. x >= 5 ) & (df. x <= 10 ))

7

Додаткові ресурси

Панди: як знайти різницю між двома лініями
Pandas: як видалити рядки, що містять певний рядок
Pandas: як видалити дублікати рядків у DataFrame

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *