R でバイプロットを作成して pca 結果を視覚化する方法
主成分分析(PCA) は、データセット内の変動の大部分を説明する主成分を見つけようとする教師なし機械学習手法です。
特定のデータセットの PCA の結果を視覚化するには、バイプロットを作成します。これは、データセット内の各観測値を最初の 2 つの主成分によって形成される平面上に表示するプロットです。
R で次の基本構文を使用してバイプロットを作成できます。
#perform PCA results <- princomp(df) #create biplot to visualize results of PCA biplot(results)
次の例は、この構文を実際に使用する方法を示しています。
例: R でバイプロットを作成する方法
この例では、 USArrestsという組み込みの R データセットを使用します。
#view first six rows of USArrests dataset
head(USArrests)
Murder Assault UrbanPop Rape
Alabama 13.2 236 58 21.2
Alaska 10.0 263 48 44.5
Arizona 8.1 294 80 31.0
Arkansas 8.8 190 50 19.5
California 9.0 276 91 40.6
Colorado 7.9 204 78 38.7
次のコードを使用して PCA を実行し、結果をバイプロットで視覚化できます。
#perform PCA
results <- princomp(USArrests)
#visualize results of PCA in biplot
biplot(results)
X 軸は最初の主成分を表示し、Y 軸は 2 番目の主成分を表示します。データセットからの個々の観測値は、4 つの変数すべてが赤で表示されてグラフ内に表示されます。
プロットの外観を変更するためにbiplot関数に使用できる引数がいくつかあることに注意してください。
たとえば、次のコードを使用して、色、フォント サイズ、軸の境界、プロットのタイトル、軸のタイトル、プロット内の矢印のサイズを変更できます。
#create biplot with custom appearance biplot(results, col=c(' blue ', ' red '), cex=c(1, 1.3), xlim=c(-.4, .4), main=' PCA Results ', xlab=' First Component ', ylab=' Second Component ', expand= 1.2 )
このバイプロットは、前のバイプロットよりも少し読みやすくなっています。
バイプロットの外観を変更するために使用できる引数の完全なリストは、 ここで見つけることができます。
追加リソース
次のチュートリアルでは、主成分分析に関する追加情報を提供します。