パンダ: 列内で一意の値を見つける方法


Pandas DataFrame 列の一意の値のリストを取得する最も簡単な方法は、 unique()関数を使用することです。

このチュートリアルでは、次の pandas DataFrame でこの関数を使用する例をいくつか示します。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C'],
                   ' conference ': ['East', 'East', 'East', 'West', 'West', 'East'],
                   ' points ': [11, 8, 10, 6, 6, 5]})

#view DataFrame
df

        team conference points
0 A East 11
1 A East 8
2 A East 10
3 B West 6
4 B West 6
5 C East 5

列内の固有の値を検索する

次のコードは、DataFrame の単一列内で一意の値を検索する方法を示しています。

 df. team . single ()

array(['A', 'B', 'C'], dtype=object)

チーム列の一意の値には「A」、「B」、「C」が含まれていることがわかります。

すべての列で一意の値を検索する

次のコードは、DataFrame のすべての列で一意の値を検索する方法を示しています。

 for col in df:
  print (df[col] .unique ())

['A' 'B' 'C']
['East' 'West']
[11 8 10 6 5]

列内の固有の値を検索して並べ替える

次のコードは、DataFrame の単一列の一意の値で検索および並べ替える方法を示しています。

 #find unique points values
points = df. points . single ()

#sort values smallest to largest
points. sort ()

#display sorted values
points

array([ 5, 6, 8, 10, 11])

列内の固有の値を見つけてカウントする

次のコードは、DataFrame の単一列内で一意の値の出現を検索してカウントする方法を示しています。

 df. team . value_counts ()

At 3
B2
C 1
Name: team, dtype: int64

追加リソース

Pandas DataFrame で単一の行を選択する方法
Pandas の複数の列の一意の値を見つける方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です