パンダ: 列の一意の値を見つけて並べ替えます


次の基本構文を使用して、pandas DataFrame の列内で一意の値を検索し、並べ替えることができます。

 df[' my_column ']. drop_duplicates (). sort_values ()

これにより、昇順に並べ替えられた列内の各一意の値を含むパンダ シリーズが返されます。

一意の値を降順に並べ替えるには、 ascending=Falseを使用します。

 df[' my_column ']. drop_duplicates (). sort_values (ascending= False )

次の例は、この構文を実際に使用する方法を示しています。

例: Pandas 列で一意の値を見つけて並べ替える

次のパンダ データフレームがあるとします。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [5, 5, 9, 12, 12, 5, 10, 13, 13, 19]})

#view DataFrame
print (df)

  team points
0 to 5
1 to 5
2 to 9
3 to 12
4 to 12
5 B 5
6 B 10
7 B 13
8 B 13
9 B 19

次の構文を使用してポイント列の一意の値を取得し、昇順に並べ替えることができます。

 #get unique values in points column and sort them
df[' points ']. drop_duplicates (). sort_values ()

0 5
2 9
6 10
3 12
7 13
9 19
Name: points, dtype: int64

出力には、ポイント列の各一意の値が昇順に並べ替えられて表示されます。

  • 5
  • 9
  • 12
  • 13
  • 19

また、 sort_values()関数でascending=False を指定することで、ポイント列の一意の値を降順でソートして取得することもできます。

 #get unique values in points column and sort them in descending order
df[' points ']. drop_duplicates (). sort_values (ascending= False )

9 19
7 13
3 12
6 10
2 9
0 5
Name: points, dtype: int64

出力には、ポイント列の各一意の値が降順に並べ替えられて表示されます。

  • 19
  • 13
  • 12
  • 9
  • 5

: pandas drop_duplicates()関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、パンダで他の一般的な機能を実行する方法を説明します。

パンダ: DataFrame で単一行を選択する方法
Pandas: インデックス列から一意の値を取得する方法
パンダ: 2 つの列の一意の組み合わせを数える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です