Como criar um biplot em r para visualizar resultados de pca


A análise de componentes principais (PCA) é uma técnica de aprendizado de máquina não supervisionada que busca encontrar os componentes principais que explicam uma grande parte da variação em um conjunto de dados.

Para visualizar os resultados do PCA para um determinado conjunto de dados, podemos criar um biplot , que é um gráfico que exibe cada observação em um conjunto de dados em um plano formado pelos dois primeiros componentes principais.

Podemos usar a seguinte sintaxe básica em R para criar um biplot:

 #perform PCA
results <- princomp(df)

#create biplot to visualize results of PCA
biplot(results)

O exemplo a seguir mostra como usar essa sintaxe na prática.

Exemplo: Como criar um biplot em R

Para este exemplo, usaremos o conjunto de dados R integrado chamado USArrests :

 #view first six rows of USArrests dataset
head(USArrests)

           Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7

Podemos usar o seguinte código para realizar PCA e visualizar os resultados em um biplot:

 #perform PCA
results <- princomp(USArrests)

#visualize results of PCA in biplot
biplot(results)

O eixo x exibe o primeiro componente principal, o eixo y exibe o segundo componente principal e as observações individuais do conjunto de dados são exibidas dentro do gráfico com todas as quatro variáveis exibidas em vermelho.

Observe que existem vários argumentos que podemos usar na função biplot para alterar a aparência do gráfico.

Por exemplo, podemos usar o código a seguir para alterar as cores, tamanho da fonte, limites dos eixos, título do gráfico, títulos dos eixos e tamanho das setas no gráfico:

 #create biplot with custom appearance
biplot(results,
       col=c(' blue ', ' red '),
       cex=c(1, 1.3),
       xlim=c(-.4, .4),
       main=' PCA Results ',
       xlab=' First Component ',
       ylab=' Second Component ',
       expand= 1.2 ) 

biplot em R

Este biplot é um pouco mais fácil de ler que o anterior.

Você pode encontrar uma lista completa de argumentos que você pode usar para alterar a aparência do biplot aqui .

Recursos adicionais

Os tutoriais a seguir fornecem informações adicionais sobre a análise de componentes principais:

Uma rápida introdução à aprendizagem supervisionada e não supervisionada
Análise de componentes principais em R: exemplo passo a passo

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *