Cara membuat matriks scatterplot di r (2 contoh)


Matriks scatterplot adalah matriks scatterplot yang memungkinkan Anda memahami hubungan berpasangan antara variabel yang berbeda dalam suatu kumpulan data.

Ada dua cara umum untuk membuat matriks scatterplot di R:

Metode 1: Gunakan Basis R

 #create scatterplot matrix (pch=20 means to use a solid circle for points)
plot(df, pch= 20 )

Metode 2: gunakan paket ggplot2 dan GGally

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df)

Contoh berikut menunjukkan cara menggunakan setiap metode dalam praktik dengan kerangka data berikut di R:

 #create data frame
df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104),
                 assists=c(33, 28, 31, 39, 40, 40, 35, 47),
                 rebounds=c(30, 28, 24, 24, 20, 20, 15, 12))

#view first few rows of data frame
head(df)

  points assists rebounds
1 99 33 30
2 90 28 28
3 86 31 24
4 88 39 24
5 95 40 20
6 99 40 20

Contoh 1: Membuat Matriks Scatterplot Menggunakan Basis R

Kita dapat menggunakan fungsi dasar R plot() untuk membuat matriks scatterplot untuk setiap variabel dalam bingkai data kita:

 #create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')

matriks scatterplot di R

Cara menafsirkan matriks adalah sebagai berikut:

  • Nama variabel ditampilkan di sepanjang kotak diagonal.
  • Semua kotak lainnya menampilkan diagram sebar hubungan antara setiap kombinasi variabel berpasangan. Misalnya, kotak di sudut kanan atas matriks menampilkan diagram sebar nilai poin dan rebound . Area kiri tengah menunjukkan sebaran nilai poin dan assist , dll.

Perhatikan bahwa cex mengontrol ukuran titik di jalur dan col mengontrol warna titik.

Contoh 2: Membuat Matriks Scatterplot Menggunakan ggplot2 dan GGally

Kita juga dapat menggunakan fungsi ggpairs() dari paket ggplot2 dan GGally di R untuk membuat matriks scatterplot untuk setiap variabel dalam bingkai data kita:

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df) 

matriks scatterplot di ggplot2

Matriks scatterplot ini berisi scatterplot yang sama dengan fungsi R base plot() , namun selain itu kita juga dapat melihat koefisien korelasi antara setiap kombinasi variabel berpasangan serta plot kepadatan untuk setiap variabel individual.

Misalnya, kita dapat melihat:

  • Koefisien korelasi antara assist dan poin adalah 0,571 .
  • Koefisien korelasi antara rebound dan poin adalah -0,598 .
  • Koefisien korelasi antara rebound dan assist adalah -0,740 .

Bintang kecil ( * ) di sebelah -0,740 juga menunjukkan bahwa korelasi antara rebound dan assist signifikan secara statistik.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara membuat matriks korelasi di R
Cara membuat point cloud berdasarkan grup di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *