Cara membuat matriks scatterplot di r (2 contoh)
Matriks scatterplot adalah matriks scatterplot yang memungkinkan Anda memahami hubungan berpasangan antara variabel yang berbeda dalam suatu kumpulan data.
Ada dua cara umum untuk membuat matriks scatterplot di R:
Metode 1: Gunakan Basis R
#create scatterplot matrix (pch=20 means to use a solid circle for points) plot(df, pch= 20 )
Metode 2: gunakan paket ggplot2 dan GGally
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:
#create data frame df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104), assists=c(33, 28, 31, 39, 40, 40, 35, 47), rebounds=c(30, 28, 24, 24, 20, 20, 15, 12)) #view first few rows of data frame head(df) points assists rebounds 1 99 33 30 2 90 28 28 3 86 31 24 4 88 39 24 5 95 40 20 6 99 40 20
Contoh 1: Membuat Matriks Scatterplot Menggunakan Basis R
Kita dapat menggunakan fungsi dasar R plot() untuk membuat matriks scatterplot untuk setiap variabel dalam bingkai data kita:
#create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')
Cara menafsirkan matriks adalah sebagai berikut:
- Nama variabel ditampilkan di sepanjang kotak diagonal.
- Semua kotak lainnya menampilkan diagram sebar hubungan antara setiap kombinasi variabel berpasangan. Misalnya, kotak di sudut kanan atas matriks menampilkan diagram sebar nilai poin dan rebound . Area kiri tengah menunjukkan sebaran nilai poin dan assist , dll.
Perhatikan bahwa cex mengontrol ukuran titik di jalur dan col mengontrol warna titik.
Contoh 2: Membuat Matriks Scatterplot Menggunakan ggplot2 dan GGally
Kita juga dapat menggunakan fungsi ggpairs() dari paket ggplot2 dan GGally di R untuk membuat matriks scatterplot untuk setiap variabel dalam bingkai data kita:
library (ggplot2) library (GGally) #create scatterplot matrix ggpairs(df)
Matriks scatterplot ini berisi scatterplot yang sama dengan fungsi R base plot() , namun selain itu kita juga dapat melihat koefisien korelasi antara setiap kombinasi variabel berpasangan serta plot kepadatan untuk setiap variabel individual.
Misalnya, kita dapat melihat:
- Koefisien korelasi antara assist dan poin adalah 0,571 .
- Koefisien korelasi antara rebound dan poin adalah -0,598 .
- Koefisien korelasi antara rebound dan assist adalah -0,740 .
Bintang kecil ( * ) di sebelah -0,740 juga menunjukkan bahwa korelasi antara rebound dan assist signifikan secara statistik.
Sumber daya tambahan
Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:
Cara membuat matriks korelasi di R
Cara membuat point cloud berdasarkan grup di R