Jak utworzyć biplot w r, aby wizualizować wyniki pca


Analiza głównych składowych (PCA) to technika uczenia maszynowego bez nadzoru , która ma na celu znalezienie głównych składowych wyjaśniających dużą część zmienności w zbiorze danych.

Aby zwizualizować wyniki PCA dla danego zbioru danych, możemy utworzyć biplot , czyli wykres przedstawiający każdą obserwację w zbiorze danych na płaszczyźnie utworzonej przez pierwsze dwa główne składniki.

Aby utworzyć biplot, możemy użyć następującej podstawowej składni w R:

 #perform PCA
results <- princomp(df)

#create biplot to visualize results of PCA
biplot(results)

Poniższy przykład pokazuje, jak zastosować tę składnię w praktyce.

Przykład: Jak utworzyć biplot w R

W tym przykładzie użyjemy wbudowanego zestawu danych R o nazwie USArrests :

 #view first six rows of USArrests dataset
head(USArrests)

           Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7

Możemy użyć następującego kodu, aby wykonać PCA i wizualizować wyniki w postaci biplotu:

 #perform PCA
results <- princomp(USArrests)

#visualize results of PCA in biplot
biplot(results)

Oś x przedstawia pierwszy główny składnik, oś y przedstawia drugi główny składnik, a poszczególne obserwacje ze zbioru danych są wyświetlane na wykresie, a wszystkie cztery zmienne są wyświetlane na czerwono.

Zauważ, że istnieje kilka argumentów, których możemy użyć w funkcji biplot , aby zmienić wygląd wykresu.

Na przykład możemy użyć poniższego kodu, aby zmienić kolory, rozmiar czcionki, granice osi, tytuł wykresu, tytuły osi i rozmiar strzałek na wykresie:

 #create biplot with custom appearance
biplot(results,
       col=c(' blue ', ' red '),
       cex=c(1, 1.3),
       xlim=c(-.4, .4),
       main=' PCA Results ',
       xlab=' First Component ',
       ylab=' Second Component ',
       expand= 1.2 ) 

biplot w R

Ten biplot jest trochę łatwiejszy do odczytania niż poprzedni.

Pełną listę argumentów, których możesz użyć do zmiany wyglądu biplotu, znajdziesz tutaj .

Dodatkowe zasoby

Poniższe samouczki zawierają dodatkowe informacje na temat analizy głównych składowych:

Krótkie wprowadzenie do uczenia się pod nadzorem i bez nadzoru
Analiza głównych składowych w R: przykład krok po kroku

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *