Pandas:如何获取列中值的频率计数
您可以使用以下方法来获取 pandas DataFrame 的列中值的频率:
方法1:以表格形式获取值的频率计数
df[' my_column ']. value_counts ()
方法2:获取字典格式的值的频率计数
df[' my_column ']. value_counts (). to_dict ()
以下示例展示了如何在实践中使用以下 pandas DataFrame 的每种方法:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'], ' points ': [12, 20, 25, 8, 12, 19, 27, 35]}) #view DataFrame print (df) team points 0 to 12 1 to 20 2 to 25 3 to 8 4 B 12 5 B 19 6 B 27 7 C 35
示例1:以表格形式获取值的频率计数
我们可以使用value_counts()函数获取 DataFrame 的team列中每个唯一值的频率计数,并以表格形式显示结果:
#get frequency count of values in 'team' column df[' team ']. value_counts () At 4 B 3 C 1 Name: team, dtype: int64
从结果我们可以看出:
- 值“A”在团队列中出现4次。
- 值“B”在团队列中出现3次。
- 值“C”在团队列中出现1次。
请注意,结果以表格形式显示。
示例2:获取字典格式的值的频率计数
我们可以使用value_counts()函数和to_dict()函数来获取 DataFrame 的team列中每个唯一值的频率计数,并以字典格式显示结果:
#get frequency count of values in 'team' column and display in dictionary df[' team ']. value_counts (). to_dict () {'A': 4, 'B': 3, 'C': 1}
团队列中每个唯一值的频率计数以字典形式显示。
例如,我们可以看到:
- 值“A”在团队列中出现4次。
- 值“B”在团队列中出现3次。
- 值“C”在团队列中出现1次。
这与先前方法的频率计数相匹配。
结果只是以不同的格式显示。
其他资源
以下教程解释了如何在 pandas 中执行其他常见任务:
Pandas:如何使用 GroupBy 和值计数
Pandas:如何使用 GroupBy 和 bin 计数
Pandas:如何计算有条件的列中的值