如何计算 pandas 中的唯一值:举例


您可以使用nunique()函数来计算 pandas DataFrame 中唯一值的数量。

该函数使用以下基本语法:

 #count unique values in each column
df. nunique ()

#count unique values in each row
df. nunique (axis= 1 )

以下示例展示了如何在实践中通过以下 pandas DataFrame 使用此函数:

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
                   ' points ': [8, 8, 13, 13, 22, 22, 25, 29],
                   ' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})

#view DataFrame
df

	team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12

示例1:计算每列中的唯一值

下面的代码展示了如何计算DataFrame每一列中唯一值的数量:

 #count unique values in each column
df. nunique ()

team 2
points 5
assists 5
rebounds 6
dtype: int64

从结果我们可以看出:

  • “团队”列有2 个唯一值
  • “points”列有5 个唯一值
  • “协助”栏有5 个唯一值
  • “篮板”列有6 个唯一值

示例2:计算每行中的唯一值

下面的代码展示了如何计算DataFrame每一行中唯一值的数量:

 #count unique values in each row
df. nunique (axis= 1 )

0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64

从结果我们可以看出:

  • 第一行有4 个唯一值
  • 第二行有2 个唯一值
  • 第三行有4 个唯一值

等等。

示例3:计算每组的唯一值

下面的代码展示了如何计算DataFrame中每组唯一值的数量:

 #count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()

team
At 2
B 3
Name: points, dtype: int64

从结果我们可以看出:

  • 团队“A”有2 个独特的“分”值
  • 团队“B”有3 个独特的“点”值

其他资源

以下教程解释了如何在 pandas 中执行其他常见操作:

如何统计大熊猫的群体目击事件
如何统计pandas中的缺失值
如何使用 Pandas value_counts() 函数

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注