Pandas: как получить частоту значений в столбце
Вы можете использовать следующие методы, чтобы получить частоту значений в столбце DataFrame pandas:
Способ 1: Получить частоту значений в табличной форме
df[' my_column ']. value_counts ()
Способ 2: Получить частоту значений в словарном формате
df[' my_column ']. value_counts (). to_dict ()
В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'], ' points ': [12, 20, 25, 8, 12, 19, 27, 35]}) #view DataFrame print (df) team points 0 to 12 1 to 20 2 to 25 3 to 8 4 B 12 5 B 19 6 B 27 7 C 35
Пример 1. Получение частоты значений в табличной форме.
Мы можем использовать функцию value_counts() , чтобы получить частоту каждого уникального значения в столбце команды DataFrame и отобразить результаты в табличной форме:
#get frequency count of values in 'team' column df[' team ']. value_counts () At 4 B 3 C 1 Name: team, dtype: int64
По результатам мы видим:
- Значение «А» появляется в столбце команды 4 раза.
- Значение «B» появляется 3 раза в столбце команды.
- Значение «C» появляется 1 раз в столбце команды.
Обратите внимание, что результаты отображаются в табличной форме.
Пример 2: Получить частоту значений в словарном формате
Мы можем использовать функцию value_counts() и функцию to_dict() , чтобы получить частоту каждого уникального значения в столбце команды DataFrame и отобразить результаты в словарном формате:
#get frequency count of values in 'team' column and display in dictionary df[' team ']. value_counts (). to_dict () {'A': 4, 'B': 3, 'C': 1}
Частота каждого уникального значения в столбце команды отображается в форме словаря.
Например, мы можем увидеть:
- Значение «А» появляется в столбце команды 4 раза.
- Значение «B» появляется 3 раза в столбце команды.
- Значение «C» появляется 1 раз в столбце команды.
Это соответствует частоте, полученной в предыдущем методе.
Результаты просто отображаются в другом формате.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:
Pandas: как использовать GroupBy и подсчет значений
Pandas: как использовать GroupBy для подсчета ячеек
Pandas: Как посчитать значения в столбце с условием