So erstellen sie einen biplot in r, um pca-ergebnisse zu visualisieren


Die Hauptkomponentenanalyse (PCA) ist eine unbeaufsichtigte Technik des maschinellen Lernens, die versucht, die Hauptkomponenten zu finden, die einen großen Teil der Variation in einem Datensatz erklären.

Um die PCA-Ergebnisse für einen bestimmten Datensatz zu visualisieren, können wir einen Biplot erstellen, bei dem es sich um einen Plot handelt, der jede Beobachtung in einem Datensatz auf einer Ebene anzeigt, die durch die ersten beiden Hauptkomponenten gebildet wird.

Wir können die folgende grundlegende Syntax in R verwenden, um einen Biplot zu erstellen:

 #perform PCA
results <- princomp(df)

#create biplot to visualize results of PCA
biplot(results)

Das folgende Beispiel zeigt, wie diese Syntax in der Praxis verwendet wird.

Beispiel: So erstellen Sie einen Biplot in R

Für dieses Beispiel verwenden wir den integrierten R-Datensatz namens USArrests :

 #view first six rows of USArrests dataset
head(USArrests)

           Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7

Wir können den folgenden Code verwenden, um PCA durchzuführen und die Ergebnisse in einem Biplot zu visualisieren:

 #perform PCA
results <- princomp(USArrests)

#visualize results of PCA in biplot
biplot(results)

Die x-Achse zeigt die erste Hauptkomponente, die y-Achse die zweite Hauptkomponente und einzelne Beobachtungen aus dem Datensatz werden im Diagramm angezeigt, wobei alle vier Variablen rot angezeigt werden.

Beachten Sie, dass es mehrere Argumente gibt, die wir für die Biplot- Funktion verwenden können, um das Erscheinungsbild des Diagramms zu ändern.

Beispielsweise können wir den folgenden Code verwenden, um die Farben, die Schriftgröße, die Achsengrenzen, den Plottitel, die Achsentitel und die Größe der Pfeile im Plot zu ändern:

 #create biplot with custom appearance
biplot(results,
       col=c(' blue ', ' red '),
       cex=c(1, 1.3),
       xlim=c(-.4, .4),
       main=' PCA Results ',
       xlab=' First Component ',
       ylab=' Second Component ',
       expand= 1.2 ) 

Biplot in R

Dieser Biplot ist etwas einfacher zu lesen als der vorherige.

Eine vollständige Liste der Argumente, mit denen Sie das Erscheinungsbild des Biplots ändern können, finden Sie hier .

Zusätzliche Ressourcen

Die folgenden Tutorials bieten zusätzliche Informationen zur Hauptkomponentenanalyse:

Eine kurze Einführung in überwachtes und unbeaufsichtigtes Lernen
Hauptkomponentenanalyse in R: Schritt-für-Schritt-Beispiel

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert