Comment créer un biplot dans R pour visualiser les résultats de la PCA



L’analyse en composantes principales (ACP) est une technique d’apprentissage automatique non supervisée qui cherche à trouver les composantes principales qui expliquent une grande partie de la variation dans un ensemble de données.

Pour visualiser les résultats de l’ACP pour un ensemble de données donné, nous pouvons créer un biplot , qui est un tracé qui affiche chaque observation d’un ensemble de données sur un plan formé par les deux premiers composants principaux.

Nous pouvons utiliser la syntaxe de base suivante dans R pour créer un biplot :

#perform PCA
results <- princomp(df)

#create biplot to visualize results of PCA
biplot(results)

L’exemple suivant montre comment utiliser cette syntaxe dans la pratique.

Exemple : Comment créer un biplot dans R

Pour cet exemple, nous utiliserons l’ensemble de données R intégré appelé USArrests :

#view first six rows of USArrests dataset
head(USArrests)

           Murder Assault UrbanPop Rape
Alabama      13.2     236       58 21.2
Alaska       10.0     263       48 44.5
Arizona       8.1     294       80 31.0
Arkansas      8.8     190       50 19.5
California    9.0     276       91 40.6
Colorado      7.9     204       78 38.7

Nous pouvons utiliser le code suivant pour effectuer une PCA et visualiser les résultats dans un biplot :

#perform PCA
results <- princomp(USArrests)

#visualize results of PCA in biplot
biplot(results)

L’axe des x affiche la première composante principale, l’axe des y affiche la deuxième composante principale et les observations individuelles de l’ensemble de données sont affichées à l’intérieur du graphique avec les quatre variables affichées en rouge.

Notez qu’il existe plusieurs arguments que nous pouvons utiliser dans la fonction biplot pour modifier l’apparence du tracé.

Par exemple, nous pouvons utiliser le code suivant pour modifier les couleurs, la taille de la police, les limites des axes, le titre du tracé, les titres des axes et la taille des flèches dans le tracé :

#create biplot with custom appearance
biplot(results,
       col=c('blue', 'red'),
       cex=c(1, 1.3),
       xlim=c(-.4, .4),
       main='PCA Results',
       xlab='First Component',
       ylab='Second Component',
       expand=1.2)

biplot dans R

Ce biplot est un peu plus facile à lire que le précédent.

Vous pouvez trouver une liste complète des arguments que vous pouvez utiliser pour modifier l’apparence du biplot ici .

Ressources additionnelles

Les didacticiels suivants fournissent des informations supplémentaires sur l’analyse des composantes principales :

Une introduction rapide à l’apprentissage supervisé et non supervisé
Analyse des composantes principales dans R : exemple étape par étape

Ajouter un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *