如何在 pandas 中创建散点矩阵(附示例)


散点图矩阵顾名思义:散点图矩阵。

这种类型的矩阵很有用,因为它允许您同时可视化数据集中多个变量之间的关系。

您可以使用scatter_matrix()函数从 pandas DataFrame 创建散点矩阵:

 p.d. plotting . scatter_matrix (df)

以下示例展示了如何在实践中通过以下 pandas DataFrame 使用此语法:

 import pandas as pd
import numpy as np

#make this example reproducible
n.p. random . seeds (0)

#createDataFrame
df = pd. DataFrame ({' points ': np.random.randn(1000),
                   ' assists ': np.random.randn(1000),
                   ' rebounds ': np.random.randn(1000)})

#view first five rows of DataFrame
df. head ()

	points assists rebounds
0 1.764052 0.555963 -1.532921
1 0.400157 0.892474 -1.711970
2 0.978738 -0.422315 0.046135
3 2.240893 0.104714 -0.958374
4 1.867558 0.228053 -0.080812

示例 1:基本扩散矩阵

以下代码展示了如何创建基本色散矩阵:

 p.d. plotting . scatter_matrix (df)

大熊猫的分散矩阵

示例 2:特定列的散布矩阵

以下代码展示了如何仅为 DataFrame 的前两列创建散布矩阵:

 p.d. plotting . scatter_matrix (df. iloc [:, 0:2])

示例 3:具有自定义颜色和 bin 的散点矩阵

以下代码演示了如何使用自定义颜色和特定数量的直方图组创建散点矩阵:

 p.d. plotting . scatter_matrix (df, color=' red ', hist_kwds={' bins ': 30 , 'color': ' red '})

具有自定义颜色的熊猫散布矩阵

示例 4:带有 KDE 图的色散矩阵

以下代码展示了如何创建一个离散矩阵,其中沿矩阵对角线使用核密度估计图而不是直方图:

 p.d. plotting . scatter_matrix (df, diagonal=' kde ')

您可以在此处找到scatter_matrix()函数的完整在线文档。

其他资源

以下教程介绍了如何在 Python 中创建其他常见图表:

如何在 Python 中创建热图
如何用 Python 创建钟形曲线
如何用 Python 创建 Ogive 图表

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注