Pandas:如何查找列中的唯一值
获取 Pandas DataFrame 列中唯一值列表的最简单方法是使用unique()函数。
本教程提供了几个将此函数与以下 pandas DataFrame 结合使用的示例:
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'], ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'], ' points ': [11, 8, 10, 6, 6, 5]}) #view DataFrame df team conference points 0 A East 11 1 A East 8 2 A East 10 3 B West 6 4 B West 6 5 C East 5
查找列中的唯一值
以下代码展示了如何在DataFrame的单列中查找唯一值:
df. team . single () array(['A', 'B', 'C'], dtype=object)
我们可以看到团队栏中的唯一值包括“A”、“B”和“C”。
查找所有列中的唯一值
以下代码展示了如何在DataFrame的所有列中查找唯一值:
for col in df: print (df[col] .unique ()) ['A' 'B' 'C'] ['East' 'West'] [11 8 10 6 5]
查找列中的唯一值并对其进行排序
以下代码展示了如何在 DataFrame 的单列中按唯一值进行搜索和排序:
#find unique points values points = df. points . single () #sort values smallest to largest points. sort () #display sorted values points array([ 5, 6, 8, 10, 11])
查找并计算列中的唯一值
下面的代码展示了如何查找并统计DataFrame单列中唯一值的出现次数:
df. team . value_counts () At 3 B2 C 1 Name: team, dtype: int64