如何在 r 中创建散点图矩阵(2 个示例)
散点图矩阵是一种散点图矩阵,可以让您了解数据集中不同变量之间的成对关系。
在 R 中创建散点图矩阵有两种常见方法:
方法一:使用Base R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
方法2:使用ggplot2和GGally包
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
以下示例展示了如何在 R 中使用以下数据框实际使用每种方法:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
示例 1:使用 Base R 创建散点图矩阵
我们可以使用基本的Rplot()函数为数据框中的每个变量创建一个散点图矩阵:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
矩阵的解释方式如下:
- 变量名称沿着对角框显示。
- 所有其他框显示变量的每个成对组合之间关系的散点图。例如,矩阵右上角的框显示了点和篮板值的散点图。左中区域显示了得分和助攻等值的散点图。
请注意, cex控制路径中点的大小, col控制点的颜色。
示例 2:使用 ggplot2 和 GGally 创建散点图矩阵
我们还可以使用 R 中 ggplot2 和 GGally 包中的ggpairs()函数为数据框中的每个变量创建散点图矩阵:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
该散点图矩阵包含与 R 基本plot()函数相同的散点图,但此外我们还可以看到变量的每个成对组合之间的相关系数以及每个单独变量的密度图。
例如,我们可以看到:
- 助攻数与得分之间的相关系数为0.571 。
- 篮板数与得分之间的相关系数为-0.598 。
- 篮板和助攻之间的相关系数为-0.740 。
-0.740 旁边的小星 ( * ) 也表明篮板和助攻之间的相关性具有统计显着性。
其他资源
以下教程解释了如何在 R 中执行其他常见任务: