Pandas: 列内の値の頻度数を取得する方法
次のメソッドを使用して、pandas DataFrame の列内の値の頻度を取得できます。
方法 1: 値の頻度カウントを表形式で取得する
df[' my_column ']. value_counts ()
方法2: 値の頻度数を辞書形式で取得する
df[' my_column ']. value_counts (). to_dict ()
次の例は、次の pandas DataFrame で各メソッドを実際に使用する方法を示しています。
import pandas as pd #createDataFrame df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'C'], ' points ': [12, 20, 25, 8, 12, 19, 27, 35]}) #view DataFrame print (df) team points 0 to 12 1 to 20 2 to 25 3 to 8 4 B 12 5 B 19 6 B 27 7 C 35
例 1: 値の頻度カウントを表形式で取得する
value_counts()関数を使用して、DataFrame のチーム列内の各一意の値の頻度カウントを取得し、結果を表形式で表示できます。
#get frequency count of values in 'team' column df[' team ']. value_counts () At 4 B 3 C 1 Name: team, dtype: int64
結果から次のことがわかります。
- 値「A」がチーム列に4回表示されます。
- 値「B」がチーム列に3回表示されます。
- 値「C」はチーム列に1回表示されます。
結果は表形式で表示されることに注意してください。
例2: 値の頻度数を辞書形式で取得する
value_counts()関数とto_dict()関数を使用して、DataFrame のチーム列内の各一意の値の頻度カウントを取得し、結果を辞書形式で表示できます。
#get frequency count of values in 'team' column and display in dictionary df[' team ']. value_counts (). to_dict () {'A': 4, 'B': 3, 'C': 1}
チーム列の各固有値の頻度数が辞書形式で表示されます。
たとえば、次のことがわかります。
- 値「A」がチーム列に4回表示されます。
- 値「B」がチーム列に3回表示されます。
- 値「C」はチーム列に1回表示されます。
これは、前の方法の頻度カウントと一致します。
結果は単に別の形式で表示されるだけです。
追加リソース
次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。
パンダ: GroupBy と値のカウントの使用方法
パンダ: ビン数で GroupBy を使用する方法
Pandas: 条件付きで列の値をカウントする方法