Come creare un biplot in r per visualizzare i risultati pca
L’analisi delle componenti principali (PCA) è una tecnica di apprendimento automatico non supervisionata che cerca di trovare le componenti principali che spiegano gran parte della variazione in un set di dati.
Per visualizzare i risultati della PCA per un dato set di dati, possiamo creare un biplot , ovvero un grafico che mostra ciascuna osservazione in un set di dati su un piano formato dai primi due componenti principali.
Possiamo usare la seguente sintassi di base in R per creare un biplot:
#perform PCA results <- princomp(df) #create biplot to visualize results of PCA biplot(results)
L’esempio seguente mostra come utilizzare questa sintassi nella pratica.
Esempio: come creare un biplot in R
Per questo esempio, utilizzeremo il set di dati R integrato chiamato USArrests :
#view first six rows of USArrests dataset
head(USArrests)
Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7
Possiamo utilizzare il seguente codice per eseguire PCA e visualizzare i risultati in un biplot:
#perform PCA
results <- princomp(USArrests)
#visualize results of PCA in biplot
biplot(results)
L’asse x mostra la prima componente principale, l’asse y mostra la seconda componente principale e le singole osservazioni del set di dati vengono visualizzate all’interno del grafico con tutte e quattro le variabili visualizzate in rosso.
Tieni presente che esistono diversi argomenti che possiamo utilizzare per la funzione biplot per modificare l’aspetto della trama.
Ad esempio, possiamo utilizzare il seguente codice per modificare i colori, la dimensione del carattere, i limiti degli assi, il titolo della trama, i titoli degli assi e la dimensione delle frecce nella trama:
#create biplot with custom appearance biplot(results, col=c(' blue ', ' red '), cex=c(1, 1.3), xlim=c(-.4, .4), main=' PCA Results ', xlab=' First Component ', ylab=' Second Component ', expand= 1.2 )
Questo biplot è un po’ più facile da leggere rispetto al precedente.
Puoi trovare un elenco completo degli argomenti che puoi utilizzare per modificare l’aspetto del biplot qui .
Risorse addizionali
Le seguenti esercitazioni forniscono informazioni aggiuntive sull’analisi delle componenti principali:
Una rapida introduzione all’apprendimento supervisionato e non supervisionato
Analisi delle componenti principali in R: esempio passo passo