Matplotlib で分布プロットを作成する方法
Python で分布図を作成するには、次の 2 つの一般的な方法があります。
方法 1: Matplotlib を使用してヒストグラムを作成する
import matplotlib. pyplot as plt
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
color はバーの塗りつぶしの色を制御し、 ec はバーの端の色を制御し、 bins はヒストグラム内のビンの数を制御することに注意してください。
方法 2: Seaborn を使用して密度曲線を含むヒストグラムを作成する
import seaborn as sns
sns. displot (data, kde= True , bins= 15 )
kde=Trueは、密度曲線をヒストグラムに重ね合わせる必要があることを指定していることに注意してください。
次の例は、各メソッドを実際に使用して、次の NumPy 配列の値の分布を視覚化する方法を示しています。
import numpy as np
#make this example reproducible.
n.p. random . seed ( 1 )
#create numpy array with 1000 values that follows normal dist with mean=10 and sd=2
data = np. random . normal (size= 1000 , loc= 10 , scale= 2 )
#view first five values
data[: 5 ]
array([13.24869073, 8.77648717, 8.9436565, 7.85406276, 11.73081526])
例 1: Matplotlib を使用してヒストグラムを作成する
次のコードを使用して Matplotlib でヒストグラムを作成し、NumPy 配列内の値の分布を視覚化できます。
import matplotlib. pyplot as plt
#create histogram
plt. hist (data, color=' lightgreen ', ec=' black ', bins= 15 )
X 軸は NumPy 配列の値を表示し、Y 軸はこれらの値の頻度を表示します。
bins引数に使用する値が大きいほど、ヒストグラム内のバーの数が増えることに注意してください。
例 2: Seaborn を使用して密度曲線を含むヒストグラムを作成する
次のコードを使用すると、seaborn データ視覚化ライブラリを使用して密度曲線がオーバーレイされたヒストグラムを作成できます。
import seaborn as sns
#create histogram with density curve overlaid
sns. displot (data, kde= True , bins= 15 )
結果は、濃度曲線が重ねられたヒストグラムです。
密度曲線を使用する利点は、単一の連続曲線を使用して分布の形状を要約できることです。
注: seaborn displot()関数の完全なドキュメントは ここで見つけることができます。
追加リソース
次のチュートリアルでは、Python で他の一般的なグラフを作成する方法を説明します。
Matplotlib で積み上げ棒グラフを作成する方法
Matplotlib で相対頻度ヒストグラムを作成する方法
Seaborn で水平バープロットを作成する方法