Pandas: підраховує випадки істини та хибності в стовпці


Ви можете використовувати наступний базовий синтаксис для підрахунку значень True і False у стовпці pandas DataFrame:

 df[' my_boolean_column ']. value_counts ()

Це буде підраховувати значення True і False.

Якщо ви хочете підрахувати лише одне з конкретних значень, ви можете використовувати такий синтаксис:

 #count occurrences of True
df[' my_boolean_column ']. values . sum ()

#count occurrences of False
( ~ df[' my_boolean_column ']). values . sum ()

У наступному прикладі показано, як використовувати цей синтаксис на практиці.

Приклад: підрахунок повторень true і false у пандах

Припустімо, що у нас є такий фрейм даних pandas, який містить інформацію про різних баскетболістів:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C'],
                   ' points ': [18, 22, 19, 14, 14, 28, 20],
                   ' all_star ': [True, False, False, True, False, True, True]})

#view DataFrame
print (df)

  team points all_star
0 A 18 True
1 To 22 False
2 To 19 False
3 B 14 True
4 B 14 False
5 C 28 True
6 C 20 True

Ми можемо використовувати функцію value_counts() для підрахунку входжень значень True і False у стовпці all_star :

 #count occurrences of True and False in all_star column
df[' all_star ']. value_counts ()

True 4
False 3
Name: all_star, dtype: int64

З результату ми бачимо:

  • True відображається 4 рази в стовпці all_star .
  • Значення False з’являється 3 рази в стовпці all_star .

Ви також можете використовувати такий синтаксис, щоб підрахувати лише випадки True:

 #count occurrences of True in all_star column
df[' all_star ']. values . sum ()

4

І ви можете використовувати такий синтаксис, щоб підрахувати лише випадки False:

 #count occurrences of False in all_star column
( ~ df[' all_star ']). values . sum ()

3

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в pandas:

Pandas: як використовувати GroupBy і підрахунок значень
Pandas: як використовувати GroupBy із підрахунком bin
Pandas: як підрахувати значення в стовпці з умовою

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *