Pandas:如何获取列中值的频率计数


您可以使用以下方法来获取 pandas DataFrame 的列中值的频率:

方法1:以表格形式获取值的频率计数

 df[' my_column ']. value_counts ()

方法2:获取字典格式的值的频率计数

 df[' my_column ']. value_counts (). to_dict ()

以下示例展示了如何在实践中使用以下 pandas DataFrame 的每种方法:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'],
                   ' points ': [12, 20, 25, 8, 12, 19, 27, 35]})

#view DataFrame
print (df)

  team points
0 to 12
1 to 20
2 to 25
3 to 8
4 B 12
5 B 19
6 B 27
7 C 35

示例1:以表格形式获取值的频率计数

我们可以使用value_counts()函数获取 DataFrame 的team列中每个唯一值的频率计数,并以表格形式显示结果:

 #get frequency count of values in 'team' column
df[' team ']. value_counts ()

At 4
B 3
C 1
Name: team, dtype: int64

从结果我们可以看出:

  • 值“A”在团队列中出现4次。
  • 值“B”在团队列中出现3次。
  • 值“C”在团队列中出现1次。

请注意,结果以表格形式显示。

示例2:获取字典格式的值的频率计数

我们可以使用value_counts()函数和to_dict()函数来获取 DataFrame 的team列中每个唯一值的频率计数,并以字典格式显示结果:

 #get frequency count of values in 'team' column and display in dictionary
df[' team ']. value_counts (). to_dict ()

{'A': 4, 'B': 3, 'C': 1}

团队列中每个唯一值的频率计数以字典形式显示。

例如,我们可以看到:

  • 值“A”在团队列中出现4次。
  • 值“B”在团队列中出现3次。
  • 值“C”在团队列中出现1次。

这与先前方法的频率计数相匹配。

结果只是以不同的格式显示。

其他资源

以下教程解释了如何在 pandas 中执行其他常见任务:

Pandas:如何使用 GroupBy 和值计数
Pandas:如何使用 GroupBy 和 bin 计数
Pandas:如何计算有条件的列中的值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注