Pandas value_counts() 関数の使用方法 (例付き)


value_counts()関数を使用して、pandas シリーズの一意の値の頻度をカウントできます。

この関数は次の基本構文を使用します。

 my_series. value_counts ()

次の例は、この構文を実際に使用する方法を示しています。

例 1: 固有値の頻度をカウントする

次のコードは、pandas シリーズ内で一意の値の出現をカウントする方法を示しています。

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts ()

3 4
4 2
7 2
8 1
9 1
dtype: int64

これは次のことを示しています。

  • 値 3 が4回出現します。
  • 値 4 が2 回表示されます。
  • 値 7 が2 回表示されます。

等々。

例2:一意の値(NaNを含む)の頻度をカウントする

デフォルトでは、 value_counts()関数は NaN 値の頻度を表示しません。

ただし、 dropna引数を使用すると、NaN 値の頻度を表示できます。

 import pandas as pd
import numpy as np

#create pandas Series with some NaN values
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9, np.nan, np.nan])

#count occurrences of unique values in Series, including NaNs
my_series. value_counts (dropna= False )

3.0 4
4.0 2
7.0 2
NaN2
8.0 1
9.0 1
dtype: int64

例 3: 一意の値の相対頻度をカウントする

次のコードは、 normalize引数を使用して、pandas シリーズの一意の値の相対頻度をカウントする方法を示しています。

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (normalize= True )

3 0.4
4 0.2
7 0.2
8 0.1
9 0.1
dtype:float64

これは次のことを示しています。

  • 値 3 は、系列内のすべての値の40%を表します。
  • 値 4 は、系列内のすべての値の20%を表します。
  • 値 7 は、系列内のすべての値の20%を表します。

等々。

例 4: ビン内の頻度をカウントする

次のコードは、 bins引数を使用して、同じサイズのビンに分類される pandas シリーズ内の値の頻度をカウントする方法を示しています。

 import pandas as pd

#create pandas Series
my_series = pd. Series ([3, 3, 3, 3, 4, 4, 7, 7, 8, 9])

#count occurrences of unique values in Series
my_series. value_counts (bins= 3 )

(3.0, 5.0] 6
(5.0, 7.0] 2
(7.0, 9.0] 2
dtype: int64

これは次のことを示しています。

  • 3と5の間には6つの値があります。
  • 5と7の間には2つの値があります。
  • 7と9の間には2つの値があります。

例 5: Pandas DataFrame の値の頻度をカウントする

value_counts()関数を使用して、パンダ データフレームの特定の列の一意の値の頻度を計算することもできます。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [9, 9, 9, 10, 10, 13, 15, 22],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12]})
#count occurrences of unique values in 'points' column
df[' points ']. value_counts ()

9 3
10 2
13 1
15 1
22 1
Name: points, dtype: int64

追加リソース

次のチュートリアルでは、パンダで他の一般的な関数を使用する方法を説明します。

Pandasでdescribe()関数を使用する方法
Pandas で行数をカウントする方法
パンダの集団目撃数を数える方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です