如何在 r 中创建和解释对图
配对图是一种散点图矩阵,可让您了解数据集中不同变量之间的成对关系。
幸运的是,使用pairs()函数在R中创建对图很容易。本教程提供了该功能实际使用的几个示例。
示例 1:所有变量的配对图
以下代码演示了如何在 R 中为数据框中的所有变量创建碱基对图:
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
矩阵的解释方式如下:
- 变量名称沿着对角框显示。
- 所有其他框显示变量的每个成对组合之间关系的散点图。例如,矩阵右上角的区域显示var1和var3值的散点图。左中框显示var1和var2值的散点图,依此类推。
这张图让我们了解了数据集中每对变量之间的关系。例如, var1和var2似乎呈正相关,而var1和var3似乎几乎没有相关性或没有相关性。
示例 2:绘制成对的特定变量
以下代码演示了如何仅为数据集中的前两个变量创建碱基对图:
#create pairs plot for var1 and var2 only
even(df[, 1:2])
示例 3:更改配对图的美观
以下代码演示了如何更改对图的美观,包括标题、颜色和标签:
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
示例 4:获取与 ggpairs 的相关性
您还可以使用 GGally 库中的ggpairs()函数获取变量之间的Pearson 相关系数。下面的代码演示了如何使用该函数:
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
这个矩阵的解释方式如下:
- 变量名称显示在矩阵的外边缘。
- 沿对角线的框显示每个变量的密度图。
- 左下角的框显示每个变量之间的散点图。
- 右上角的框显示每个变量之间的皮尔逊相关系数。例如,var1 和 var2 之间的相关性为0.425 。
与基本 Rpairs ()函数相比,使用ggpairs()的优点是可以获得有关变量的更多信息。具体来说,您可以看到变量的每个成对组合之间的相关系数以及每个单独变量的密度图。
您可以在此处找到 ggpairs() 函数的完整文档。