Hoe u een biplot in r maakt om pca-resultaten te visualiseren


Principal Component Analysis (PCA) is een machine learning-techniek zonder toezicht die tot doel heeft de belangrijkste componenten te vinden die een groot deel van de variatie in een dataset verklaren.

Om de resultaten van PCA voor een bepaalde dataset te visualiseren, kunnen we een biplot maken. Dit is een plot die elke waarneming in een dataset weergeeft op een vlak dat wordt gevormd door de eerste twee hoofdcomponenten.

We kunnen de volgende basissyntaxis in R gebruiken om een biplot te maken:

 #perform PCA
results <- princomp(df)

#create biplot to visualize results of PCA
biplot(results)

Het volgende voorbeeld laat zien hoe u deze syntaxis in de praktijk kunt gebruiken.

Voorbeeld: Hoe maak je een biplot in R

Voor dit voorbeeld gebruiken we de ingebouwde R-dataset genaamd USArrests :

 #view first six rows of USArrests dataset
head(USArrests)

           Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7

We kunnen de volgende code gebruiken om PCA uit te voeren en de resultaten in een biplot te visualiseren:

 #perform PCA
results <- princomp(USArrests)

#visualize results of PCA in biplot
biplot(results)

Op de x-as wordt de eerste hoofdcomponent weergegeven, op de y-as de tweede hoofdcomponent, en individuele waarnemingen uit de dataset worden in de grafiek weergegeven, waarbij alle vier de variabelen in rood worden weergegeven.

Merk op dat er verschillende argumenten zijn die we kunnen gebruiken voor de biplotfunctie om het uiterlijk van de plot te veranderen.

We kunnen bijvoorbeeld de volgende code gebruiken om de kleuren, lettergrootte, asgrenzen, plottitel, astitels en grootte van pijlen in de plot te wijzigen:

 #create biplot with custom appearance
biplot(results,
       col=c(' blue ', ' red '),
       cex=c(1, 1.3),
       xlim=c(-.4, .4),
       main=' PCA Results ',
       xlab=' First Component ',
       ylab=' Second Component ',
       expand= 1.2 ) 

dubbelplot in R

Deze biplot is iets gemakkelijker te lezen dan de vorige.

Hier vindt u een volledige lijst met argumenten die u kunt gebruiken om het uiterlijk van de biplot te wijzigen.

Aanvullende bronnen

De volgende zelfstudies bieden aanvullende informatie over de analyse van hoofdcomponenten:

Een korte introductie tot begeleid en onbewaakt leren
Hoofdcomponentenanalyse in R: stapsgewijs voorbeeld

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert