Pandas value_counts() 関数の使用方法 (例付き)
value_counts()関数を使用して、pandas シリーズの一意の値の頻度をカウントできます。
この関数は次の基本構文を使用します。
my_series. value_counts ()
次の例は、この構文を実際に使用する方法を示しています。
例 1: 固有値の頻度をカウントする
次のコードは、pandas シリーズ内で一意の値の出現をカウントする方法を示しています。
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts () 3 4 4 2 7 2 8 1 9 1 dtype: int64
これは次のことを示しています。
- 値 3 が4回出現します。
- 値 4 が2 回表示されます。
- 値 7 が2 回表示されます。
等々。
例2:一意の値(NaNを含む)の頻度をカウントする
デフォルトでは、 value_counts()関数は NaN 値の頻度を表示しません。
ただし、 dropna引数を使用すると、NaN 値の頻度を表示できます。
import pandas as pd import numpy as np #create pandas Series with some NaN values my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan]) #count occurrences of unique values in Series, including NaNs my_series. value_counts (dropna= False ) 3.0 4 4.0 2 7.0 2 NaN2 8.0 1 9.0 1 dtype: int64
例 3: 一意の値の相対頻度をカウントする
次のコードは、 normalize引数を使用して、pandas シリーズの一意の値の相対頻度をカウントする方法を示しています。
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (normalize= True ) 3 0.4 4 0.2 7 0.2 8 0.1 9 0.1 dtype:float64
これは次のことを示しています。
- 値 3 は、系列内のすべての値の40%を表します。
- 値 4 は、系列内のすべての値の20%を表します。
- 値 7 は、系列内のすべての値の20%を表します。
等々。
例 4: ビン内の頻度をカウントする
次のコードは、 bins引数を使用して、同じサイズのビンに分類される pandas シリーズ内の値の頻度をカウントする方法を示しています。
import pandas as pd #create pandas Series my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9]) #count occurrences of unique values in Series my_series. value_counts (bins= 3 ) (3.0, 5.0] 6 (5.0, 7.0] 2 (7.0, 9.0] 2 dtype: int64
これは次のことを示しています。
- 3と5の間には6つの値があります。
- 5と7の間には2つの値があります。
- 7と9の間には2つの値があります。
例 5: Pandas DataFrame の値の頻度をカウントする
value_counts()関数を使用して、パンダ データフレームの特定の列の一意の値の頻度を計算することもできます。
import pandas as pd #createDataFrame df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22], ' assists ': [5, 7, 7, 9, 12, 9, 9, 4], ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]}) #count occurrences of unique values in 'points' column df[' points ']. value_counts () 9 3 10 2 13 1 15 1 22 1 Name: points, dtype: int64
追加リソース
次のチュートリアルでは、パンダで他の一般的な関数を使用する方法を説明します。
Pandasでdescribe()関数を使用する方法
Pandas で行数をカウントする方法
パンダの集団目撃数を数える方法