Pandas dataframe からヒストグラムを作成する方法


次の基本構文を使用して、pandas DataFrame からヒストグラムを作成できます。

 df. hist (column=' col_name ')

次の例は、この構文を実際に使用する方法を示しています。

例 1: 単一のヒストグラムをプロットする

次のコードは、pandas DataFrame の特定の列に対して単一のヒストグラムを作成する方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33],
                   ' assists ': [5, 7, 7, 9, 12, 9, 9, 4, 7, 7, 8, 9],
                   ' rebounds ': [11, 8, 10, 6, 6, 5, 9, 12, 10, 7, 7, 9]})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 25 5 11
1 12 7 8
2 15 7 10
3 14 9 6
4 19 12 6

#create histogram for 'points' column
df. hist (column=' points ')

特定の色、スタイル、ラベル、ビンの数を使用してヒストグラムをカスタマイズすることもできます。

 #create custom histogram for 'points' column
df. hist (column=' points ', bins= 5 , grid= False , rwidth= .9 , color=' purple ')

パンダのヒストグラム

X 軸はプレーヤーごとに獲得したポイントを示し、Y 軸は何人のプレーヤーがそのポイントを獲得したかの頻度を示します。

例 2: 複数のヒストグラムのプロット

次のコードは、pandas DataFrame から複数のヒストグラムをプロットする方法を示しています。

 import pandas as pd

#createDataFrame
df = pd. DataFrame ({' team ':['A', 'A', 'A', 'A', 'A', 'A',
                           'B', 'B', 'B', 'B', 'B', 'B'],
                   ' points ': [25, 12, 15, 14, 19, 23, 25, 29, 29, 31, 31, 33]})

#view first five rows
df. head ()

        team points
0 to 25
1 to 12
2 to 15
3 to 14
4 to 19

#create histogram for each team
df. hist (column=' points ', by=' team ', bins= 3 , grid= False , rwidth= .9 ,
        color=' purple ', sharex= True )

パンダのいくつかのヒストグラム

sharex引数は、2 つのヒストグラムが同じ x 軸を共有する必要があることを指定していることに注意してください。

これにより、2 つのヒストグラム間の値の分布を比較しやすくなります。

追加リソース

次のチュートリアルでは、Python で他の一般的なプロットを作成する方法を説明します。

Matplotlib で複数の線をプロットする方法
Pandas DataFrame から箱ひげ図を作成する方法
複数の Pandas 列を棒グラフにプロットする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です