Pandas: 列内の値の頻度数を取得する方法


次のメソッドを使用して、pandas DataFrame の列内の値の頻度を取得できます。

方法 1: 値の頻度カウントを表形式で取得する

 df[' my_column ']. value_counts ()

方法2: 値の頻度数を辞書形式で取得する

 df[' my_column ']. value_counts (). to_dict ()

次の例は、次の pandas DataFrame で各メソッドを実際に使用する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'],
                   ' points ': [12, 20, 25, 8, 12, 19, 27, 35]})

#view DataFrame
print (df)

  team points
0 to 12
1 to 20
2 to 25
3 to 8
4 B 12
5 B 19
6 B 27
7 C 35

例 1: 値の頻度カウントを表形式で取得する

value_counts()関数を使用して、DataFrame のチーム列内の各一意の値の頻度カウントを取得し、結果を表形式で表示できます。

 #get frequency count of values in 'team' column
df[' team ']. value_counts ()

At 4
B 3
C 1
Name: team, dtype: int64

結果から次のことがわかります。

  • 値「A」がチーム列に4回表示されます。
  • 値「B」がチーム列に3回表示されます。
  • 値「C」はチーム列に1回表示されます。

結果は表形式で表示されることに注意してください。

例2: 値の頻度数を辞書形式で取得する

value_counts()関数とto_dict()関数を使用して、DataFrame のチーム列内の各一意の値の頻度カウントを取得し、結果を辞書形式で表示できます。

 #get frequency count of values in 'team' column and display in dictionary
df[' team ']. value_counts (). to_dict ()

{'A': 4, 'B': 3, 'C': 1}

チーム列の各固有値の頻度数が辞書形式で表示されます。

たとえば、次のことがわかります。

  • 値「A」がチーム列に4回表示されます。
  • 値「B」がチーム列に3回表示されます。
  • 値「C」はチーム列に1回表示されます。

これは、前の方法の頻度カウントと一致します。

結果は単に別の形式で表示されるだけです。

追加リソース

次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。

パンダ: GroupBy と値のカウントの使用方法
パンダ: ビン数で GroupBy を使用する方法
Pandas: 条件付きで列の値をカウントする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です