如何在 pandas 中创建散点矩阵(附示例)
散点图矩阵顾名思义:散点图矩阵。
这种类型的矩阵很有用,因为它允许您同时可视化数据集中多个变量之间的关系。
您可以使用scatter_matrix()函数从 pandas DataFrame 创建散点矩阵:
p.d. plotting . scatter_matrix (df)
以下示例展示了如何在实践中通过以下 pandas DataFrame 使用此语法:
import pandas as pd import numpy as np #make this example reproducible n.p. random . seeds (0) #createDataFrame df = pd. DataFrame ({' points ': np.random.randn(1000), ' assists ': np.random.randn(1000), ' rebounds ': np.random.randn(1000)}) #view first five rows of DataFrame df. head () points assists rebounds 0 1.764052 0.555963 -1.532921 1 0.400157 0.892474 -1.711970 2 0.978738 -0.422315 0.046135 3 2.240893 0.104714 -0.958374 4 1.867558 0.228053 -0.080812
示例 1:基本扩散矩阵
以下代码展示了如何创建基本色散矩阵:
p.d. plotting . scatter_matrix (df)
示例 2:特定列的散布矩阵
以下代码展示了如何仅为 DataFrame 的前两列创建散布矩阵:
p.d. plotting . scatter_matrix (df. iloc [:, 0:2])
示例 3:具有自定义颜色和 bin 的散点矩阵
以下代码演示了如何使用自定义颜色和特定数量的直方图组创建散点矩阵:
p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})
示例 4:带有 KDE 图的色散矩阵
以下代码展示了如何创建一个离散矩阵,其中沿矩阵对角线使用核密度估计图而不是直方图:
p.d. plotting . scatter_matrix (df, diagonal=' kde ')
您可以在此处找到scatter_matrix()函数的完整在线文档。
其他资源
以下教程介绍了如何在 Python 中创建其他常见图表: