パンダで一意の値を数える方法: 例付き
nunique()関数を使用すると、pandas DataFrame 内の固有の値の数をカウントできます。
この関数は次の基本構文を使用します。
#count unique values in each column df. nunique () #count unique values in each row df. nunique (axis= 1 )
次の例は、実際に次の pandas DataFrame でこの関数を使用する方法を示しています。
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [8, 8, 13, 13, 22, 22, 25, 29],
' assists ': [5, 8, 7, 9, 12, 9, 9, 4],
' rebounds ': [11, 8, 11, 6, 6, 5, 9, 12]})
#view DataFrame
df
team points assists rebounds
0 to 8 5 11
1 To 8 8 8
2 to 13 7 11
3 A 13 9 6
4 B 22 12 6
5 B 22 9 5
6 B 25 9 9
7 B 29 4 12
例 1: 各列の一意の値を数える
次のコードは、DataFrame の各列の一意の値の数をカウントする方法を示しています。
#count unique values in each column
df. nunique ()
team 2
points 5
assists 5
rebounds 6
dtype: int64
結果から次のことがわかります。
- 「チーム」列には2 つの一意の値があります
- 「ポイント」列には5 つの一意の値があります
- 「支援」列には5 つの一意の値があります
- 「リバウンド」列には6 つの一意の値があります
例 2: 各行の一意の値を数える
次のコードは、DataFrame の各行の一意の値の数をカウントする方法を示しています。
#count unique values in each row
df. nunique (axis= 1 )
0 4
1 2
2 4
3 4
4 4
5 4
6 3
7 4
dtype: int64
結果から次のことがわかります。
- 最初の行には4 つの一意の値があります
- 2 行目には2 つの一意の値があります
- 3 行目には4 つの一意の値があります
等々。
例 3: グループごとに一意の値を数える
次のコードは、DataFrame 内のグループごとの一意の値の数をカウントする方法を示しています。
#count unique 'points' values, grouped by team
df. groupby (' team ')[' points ']. nunique ()
team
At 2
B 3
Name: points, dtype: int64
結果から次のことがわかります。
- チーム「A」には2 つの固有の「ポイント」値があります
- チーム「B」には3 つの固有の「ポイント」値があります
追加リソース
次のチュートリアルでは、パンダで他の一般的な操作を実行する方法を説明します。