Pandas:如何查找列中的唯一值


获取 Pandas DataFrame 列中唯一值列表的最简单方法是使用unique()函数。

本教程提供了几个将此函数与以下 pandas DataFrame 结合使用的示例:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6
5 C East 5

查找列中的唯一值

以下代码展示了如何在DataFrame的单列中查找唯一值:

 df. team . single ()

array(['A', 'B', 'C'], dtype=object)

我们可以看到团队栏中的唯一值包括“A”、“B”和“C”。

查找所有列中的唯一值

以下代码展示了如何在DataFrame的所有列中查找唯一值:

 for col in df:
  print (df[col] .unique ())

['A' 'B' 'C']
['East' 'West']
[11 8 10 6 5]

查找列中的唯一值并对其进行排序

以下代码展示了如何在 DataFrame 的单列中按唯一值进行搜索和排序:

 #find unique points values
points = df. points . single ()

#sort values smallest to largest
points. sort ()

#display sorted values
points

array([ 5, 6, 8, 10, 11])

查找并计算列中的唯一值

下面的代码展示了如何查找并统计DataFrame单列中唯一值的出现次数:

 df. team . value_counts ()

At 3
B2
C 1
Name: team, dtype: int64

其他资源

如何在 Pandas DataFrame 中选择单行
如何在Pandas中查找多列中的唯一值

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注