Pandas: как получить частоту значений в столбце


Вы можете использовать следующие методы, чтобы получить частоту значений в столбце DataFrame pandas:

Способ 1: Получить частоту значений в табличной форме

 df[' my_column ']. value_counts ()

Способ 2: Получить частоту значений в словарном формате

 df[' my_column ']. value_counts (). to_dict ()

В следующих примерах показано, как использовать каждый метод на практике со следующим DataFrame pandas:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'],
                   ' points ': [12, 20, 25, 8, 12, 19, 27, 35]})

#view DataFrame
print (df)

  team points
0 to 12
1 to 20
2 to 25
3 to 8
4 B 12
5 B 19
6 B 27
7 C 35

Пример 1. Получение частоты значений в табличной форме.

Мы можем использовать функцию value_counts() , чтобы получить частоту каждого уникального значения в столбце команды DataFrame и отобразить результаты в табличной форме:

 #get frequency count of values in 'team' column
df[' team ']. value_counts ()

At 4
B 3
C 1
Name: team, dtype: int64

По результатам мы видим:

  • Значение «А» появляется в столбце команды 4 раза.
  • Значение «B» появляется 3 раза в столбце команды.
  • Значение «C» появляется 1 раз в столбце команды.

Обратите внимание, что результаты отображаются в табличной форме.

Пример 2: Получить частоту значений в словарном формате

Мы можем использовать функцию value_counts() и функцию to_dict() , чтобы получить частоту каждого уникального значения в столбце команды DataFrame и отобразить результаты в словарном формате:

 #get frequency count of values in 'team' column and display in dictionary
df[' team ']. value_counts (). to_dict ()

{'A': 4, 'B': 3, 'C': 1}

Частота каждого уникального значения в столбце команды отображается в форме словаря.

Например, мы можем увидеть:

  • Значение «А» появляется в столбце команды 4 раза.
  • Значение «B» появляется 3 раза в столбце команды.
  • Значение «C» появляется 1 раз в столбце команды.

Это соответствует частоте, полученной в предыдущем методе.

Результаты просто отображаются в другом формате.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные задачи в pandas:

Pandas: как использовать GroupBy и подсчет значений
Pandas: как использовать GroupBy для подсчета ячеек
Pandas: Как посчитать значения в столбце с условием

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *