如何在 r 中创建双图来可视化 pca 结果


主成分分析(PCA) 是一种无监督机器学习技术,旨在找到解释数据集中大部分变化的主成分。

为了可视化给定数据集的 PCA 结果,我们可以创建一个双标图,它是在由前两个主成分形成的平面上显示数据集中的每个观测值的图。

我们可以在 R 中使用以下基本语法来创建双图:

 #perform PCA
results <- princomp(df)

#create biplot to visualize results of PCA
biplot(results)

以下示例展示了如何在实践中使用此语法。

示例:如何在 R 中创建双标图

对于此示例,我们将使用名为USArrests 的内置 R 数据集:

 #view first six rows of USArrests dataset
head(USArrests)

           Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7

我们可以使用以下代码来执行 PCA 并在双图中可视化结果:

 #perform PCA
results <- princomp(USArrests)

#visualize results of PCA in biplot
biplot(results)

x 轴显示第一个主成分,y 轴显示第二个主成分,数据集中的各个观测值显示在图表内,所有四个变量均显示为红色。

请注意,我们可以使用biplot函数的几个参数来更改绘图的外观。

例如,我们可以使用以下代码来更改颜色、字体大小、轴边界、绘图标题、轴标题和绘图中箭头的大小:

 #create biplot with custom appearance
biplot(results,
       col=c(' blue ', ' red '),
       cex=c(1, 1.3),
       xlim=c(-.4, .4),
       main=' PCA Results ',
       xlab=' First Component ',
       ylab=' Second Component ',
       expand= 1.2 ) 

R 中的双标图

这个双图比前一个更容易阅读。

您可以在此处找到可用于更改双图外观的参数的完整列表。

其他资源

以下教程提供有关主成分分析的其他信息:

监督学习和无监督学习的快速介绍
R 中的主成分分析:分步示例

添加评论

您的电子邮箱地址不会被公开。 必填项已用*标注