Pandas でカテゴリデータをプロットする方法 (例付き)
カテゴリデータを視覚化するには、次の 3 つの一般的な方法があります。
- 棒グラフ
- グループ別の箱ひげ図
- モザイクプロット
次の例は、Python で pandas DataFrame のこれらの各プロットを作成する方法を示しています。
例 1: 棒グラフ
次のコードは、特定の pandas DataFrame でのシフトの頻度を視覚化する棒グラフを作成する方法を示しています。
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'D'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create bar plot to visualize frequency of each team
df[' team ']. value_counts (). plot (kind=' bar ', xlabel=' Team ', ylabel=' Count ', rot= 0 )

X 軸は各チームの名前を示し、Y 軸はデータフレーム内の各チームの頻度を示します。
注: rot=0引数は、x 軸ラベルが x 軸に平行になるように x 軸ラベルを回転するようにパンダに指示します。
例 2: グループ別の箱ひげ図
クラスター箱ひげ図は、カテゴリ変数ごとにグループ化された数値変数を視覚化する便利な方法です。
たとえば、次のコードは、チームごとにグループ化された得点の分布を示す箱ひげ図を作成する方法を示しています。
import pandas as pd
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'],
' points ': [18, 22, 29, 25, 14, 11, 10, 15]})
#create boxplot of points, grouped by team
df. boxplot (column=[' points '], by=' team ', grid= False , color=' black ')

X 軸はチームを表示し、Y 軸は各チームが獲得したポイントの分布を表示します。
例 3: モザイク プロット
タイルプロットは、2 つの異なるカテゴリ変数の度数を 1 つのプロットに表示するプロットのタイプです。
たとえば、次のコードは、単一のプロット内のカテゴリ変数「result」と「team」の頻度を示すモザイク プロットを作成する方法を示しています。
import pandas as pd
from statsmodels. graphics . mosaicplot import mosaic
#createDataFrame
df = pd. DataFrame ({' team ': ['A', 'A', 'A', 'B', 'B', 'B', 'C', 'C', 'C'],
' result ': ['W', 'L', 'L', 'W', 'W', 'L', 'L', 'W', 'W']})
#create mosaic plot
mosaic(df, [' team ', ' result ']);

X 軸はチームを表示し、Y 軸は各チームの結果の頻度を表示します。
追加リソース
次のチュートリアルでは、パンダで他の一般的なタスクを実行する方法を説明します。
Pandas で Groupby と Plot を使用する方法
Pandasで列値の分布をプロットする方法
パンダプロットの図のサイズを調整する方法