Pandas: как подсчитать появление определенного значения в столбце
Вы можете использовать следующий синтаксис для подсчета вхождений определенного значения в столбец DataFrame pandas:
df[' column_name ']. value_counts ()[ value ]
Обратите внимание, что значение может быть числом или символом.
Следующие примеры показывают, как использовать этот синтаксис на практике.
Пример 1. Подсчет вхождений строки в столбце
Следующий код показывает, как подсчитать количество вхождений определенной строки в столбец DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of the value 'B' in the 'team' column df[' team ']. value_counts ()[' B '] 4
Из результата мы видим, что строка «B» появляется 4 раза в столбце «команда».
Обратите внимание, что мы также можем использовать следующий синтаксис, чтобы определить, как часто каждое уникальное значение появляется в столбце «команда»:
#count occurrences of every unique value in the 'team' column
df[' team ']. value_counts ()
B4
At 2
C 2
Name: team, dtype: int64
Пример 2. Подсчет вхождений числового значения в столбец
Следующий код показывает, как подсчитать количество вхождений числового значения в столбец DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'B', 'B', 'B', 'B', 'C', 'C'], ' points ': [25, 12, 15, 14, 19, 23, 25, 29], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of the value 9 in the 'assists' column df[' assists ']. value_counts ()[ 9 ] 3
Из результата мы видим, что значение 9 появляется 3 раза в столбце «помощь».
Мы также можем использовать следующий синтаксис, чтобы определить, как часто каждое уникальное значение появляется в столбце «Помощь»:
#count occurrences of every unique value in the 'assists' column
df[' assists ']. value_counts ()
9 3
7 2
5 1
12 1
4 1
Name: assists, dtype: int64
По результату мы видим:
- Значение 9 появляется 3 раза.
- Значение 7 появляется дважды.
- Значение 5 появляется 1 раз.
И так далее.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции в pandas:
Как посчитать уникальные значения в пандах
Как посчитать пропущенные значения в панде
Как подсчитать групповые наблюдения у панд