Cara membuat matriks korelasi di r (4 contoh)


Matriks korelasi adalah tabel persegi yang menunjukkan koefisien korelasi antar variabel dalam suatu kumpulan data.

Ini memberikan cara cepat untuk memahami kekuatan hubungan linier yang ada antar variabel dalam kumpulan data.

Ada empat cara umum untuk membuat matriks korelasi di R:

Metode 1: fungsi cor (untuk mendapatkan matriks koefisien korelasi sederhana)

 cor(df)

Metode 2: fungsi rcorr (untuk mendapatkan nilai p dari koefisien korelasi)

 library (Hmisc)

rcorr( as.matrix (df))

Metode 3: fungsi corrplot (untuk memvisualisasikan matriks korelasi)

 library (corplot)

corrplot(cor(df))

Metode 4: fungsi ggcorrplot (untuk memvisualisasikan matriks korelasi)

 library (ggcorrplot)

ggcorrplot(cor(df))

Contoh berikut menunjukkan cara menggunakan setiap metode dengan bingkai data berikut di R:

 #create data frame
df <- data. frame (assists=c(4, 5, 5, 6, 7, 8, 8, 10),
                 rebounds=c(12, 14, 13, 7, 8, 8, 9, 13),
                 points=c(22, 24, 26, 26, 29, 32, 20, 14))

#view data frame
df

  assists rebound points
1 4 12 22
2 5 14 24
3 5 13 26
4 6 7 26
5 7 8 29
6 8 8 32
7 8 9 20
8 10 13 14

Contoh 1: Fungsi cor

Kita dapat menggunakan fungsi R base cor() untuk membuat matriks korelasi yang menunjukkan koefisien korelasi antara setiap variabel dalam bingkai data kita:

 #create correlation matrix
cor(df)

            assists rebound points
assists 1.0000000 -0.2448608 -0.3295730
rebounds -0.2448608 1.0000000 -0.5220917
points -0.3295730 -0.5220917 1.0000000

Koefisien korelasi sepanjang diagonal tabel semuanya sama dengan 1 karena setiap variabel berkorelasi sempurna dengan variabelnya sendiri.

Semua koefisien korelasi lainnya menunjukkan korelasi antara kombinasi variabel berpasangan yang berbeda. Misalnya:

  • Koefisien korelasi antara assist dan rebound adalah -0,245 .
  • Koefisien korelasi antara assist dan poin adalah -0,330 .
  • Koefisien korelasi antara rebound dan poin adalah -0,522 .

Contoh 2: fungsi rcorr

Kita dapat menggunakan fungsi rcorr() dari paket Hmisc di R untuk membuat matriks korelasi yang menunjukkan koefisien korelasi antara setiap variabel dalam bingkai data kita:

 library (Hmisc)

#create matrix of correlation coefficients and p-values
rcorr( as.matrix (df))

         assists rebound points
assists 1.00 -0.24 -0.33
rebounds -0.24 1.00 -0.52
points -0.33 -0.52 1.00

n=8 

P
         assists rebound points
assists 0.5589 0.4253
rebounds 0.5589 0.1844
points 0.4253 0.1844

Matriks pertama menunjukkan koefisien korelasi antar variabel dan matriks kedua menunjukkan nilai p yang sesuai.

Misalnya, koefisien korelasi antara assist dan rebound adalah -0,24 dan nilai p dari koefisien korelasi ini adalah 0,5589 .

Hal ini menunjukkan bahwa korelasi antara kedua variabel adalah negatif tetapi korelasi tersebut tidak signifikan secara statistik karena nilai p tidak kurang dari 0,05.

Contoh 3: Fungsi corrplot

Kita dapat menggunakan fungsi corrplot() dari paket corrplot di R untuk memvisualisasikan matriks korelasi:

 library (corplot)

#visualize correlation matrix
corrplot(cor(df))

Warna dan ukuran lingkaran pada matriks korelasi membantu kita memvisualisasikan korelasi antar masing-masing variabel.

Misalnya, lingkaran tempat perpotongan variabel assist dan rebound berwarna kecil dan berwarna merah terang, yang menunjukkan bahwa korelasinya lemah dan negatif.

Contoh 4: Fungsi corrplot

Kita dapat menggunakan fungsi ggcorrplot() dari paket ggcorrplot di R untuk memvisualisasikan matriks korelasi:

 library (ggcorrplot)

#visualize correlation matrix
ggcorrplot(cor(df))

Warna kotak dalam matriks korelasi membantu kita memvisualisasikan korelasi antara setiap variabel.

Sumber daya tambahan

Tutorial berikut menjelaskan cara melakukan tugas umum lainnya di R:

Cara menghitung korelasi rank Spearman di R
Cara menghitung korelasi parsial di R
Cara menghitung korelasi geser di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *