Pandas で散布行列を作成する方法 (例付き)
散布図行列は、まさにその名の通り、散布図行列です。
このタイプの行列は、データセット内の複数の変数間の関係を同時に視覚化できるため便利です。
cancel_matrix()関数を使用して、pandas DataFrame から散布行列を作成できます。
p.d. plotting . scatter_matrix (df)
次の例は、実際に次の pandas DataFrame でこの構文を使用する方法を示しています。
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (0) #createDataFrame df = pd. DataFrame ({' points ': np.random.randn(1000), ' assists ': np.random.randn(1000), ' rebounds ': np.random.randn(1000)}) #view first five rows of DataFrame df. head () points assists rebounds 0 1.764052 0.555963 -1.532921 1 0.400157 0.892474 -1.711970 2 0.978738 -0.422315 0.046135 3 2.240893 0.104714 -0.958374 4 1.867558 0.228053 -0.080812
例 1: 基本的な拡散行列
次のコードは、基本的な分散行列を作成する方法を示しています。
p.d. plotting . scatter_matrix (df)
例 2: 特定の列の散布行列
次のコードは、DataFrame の最初の 2 列のみの散布行列を作成する方法を示しています。
p.d. plotting . scatter_matrix (df. iloc [:, 0:2])
例 3: カスタム カラーとビンを使用した散布行列
次のコードは、ヒストグラムのカスタム カラーと特定の数のグループを使用して散布行列を作成する方法を示しています。
p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})
例 4: KDE プロットを使用した分散行列
次のコードは、ヒストグラムの代わりに行列の対角線に沿ったカーネル密度推定プロットを含む分散行列を作成する方法を示しています。
p.d. plotting . scatter_matrix (df, diagonal=' kde ')
ここで、 scatter_matrix()関数の完全なオンライン ドキュメントを見つけることができます。
追加リソース
次のチュートリアルでは、Python で他の一般的なグラフを作成する方法を説明します。
Python でヒート マップを作成する方法
Python でベルカーブを作成する方法
Python で Ogive チャートを作成する方法