Python でペア プロットを作成する方法
ペア プロットは、データ セット内の異なる変数間のペア関係を理解できるようにする散布図行列です。
Python でペア プロットを作成する最も簡単な方法は、seaborn.pairplot(df)関数を使用することです。
次の例は、この関数を実際に使用する方法を示しています。
例 1: すべての変数のペア プロット
次のコードは、 irisという seaborn データセット内の各数値変数のペアごとのプロットを作成する方法を示しています。
import pandas as pd import matplotlib. pyplot as plt import seaborn as sns #define dataset iris = sns. load_dataset (“ iris ”) #create pairs plot for all numeric variables sns. pairplot (iris)
マトリックスを解釈する方法は次のとおりです。
- 各変数の分布は、対角線のボックスに沿ったヒストグラムとして表示されます。
- 他のすべてのボックスには、変数のペアごとの組み合わせ間の関係の散布図が表示されます。たとえば、行列の左下隅のボックスには、 petal_widthとsepal_lengthの値の散布図が表示されます。
この 1 つのグラフから、データセット内の変数の各ペア間の関係がわかります。
例 2: 特定の変数のペアをプロットする
ペア プロットに含める特定の変数のみを指定することもできます。
sns. pairplot (iris[[' sepal_length ', ' sepal_width ']])
例 3: カテゴリごとに色を付けてペアをプロットする
また、 hue引数を使用して、カテゴリ変数に基づいて各プロットの各点に色を付けるペア プロットを作成することもできます。
sns. pairplot (iris, hue=' species ')
色相引数を使用すると、データをより深く理解できます。
追加リソース
Seaborn でバープロットを作成する方法
Seaborn でヒート マップを作成する方法
Seaborn プロットにタイトルを追加する方法