Cara menghitung korelasi antar beberapa variabel di r


Salah satu cara untuk mengukur hubungan antara dua variabel adalah dengan menggunakan koefisien korelasi Pearson , yang merupakan ukuran hubungan linier antara dua variabel . Itu selalu mengambil nilai antara -1 dan 1 di mana:

  • -1 menunjukkan korelasi linier negatif sempurna antara dua variabel
  • 0 menunjukkan tidak ada korelasi linier antara dua variabel
  • Angka 1 menunjukkan korelasi linier positif sempurna antara dua variabel

Tutorial ini menjelaskan cara menghitung korelasi antara beberapa variabel di R, menggunakan kerangka data berikut sebagai contoh:

 #create data frame
df <- data.frame(a <- c(2, 3, 3, 5, 6, 9, 14, 15, 19, 21, 22, 23),
                 b <- c(23, 24, 24, 23, 17, 28, 38, 34, 35, 39, 41, 43),
                 c <- c(13, 14, 14, 14, 15, 17, 18, 19, 22, 20, 24, 26),
                 d <- c(6, 6, 7, 8, 8, 8, 7, 6, 5, 3, 3, 2))

Contoh 1: Korelasi antara dua variabel

Kode berikut menunjukkan cara menghitung korelasi antara dua variabel dalam bingkai data:

 cor(df$a, df$b)

[1] 0.9279869

Contoh 2: Korelasi antara beberapa variabel

Kode berikut menunjukkan cara menghitung korelasi antara tiga variabel dalam bingkai data:

 cor(df[, c(' a ', ' b ', ' c ')])

          ABC
a 1.0000000 0.9279869 0.9604329
b 0.9279869 1.0000000 0.8942139
c 0.9604329 0.8942139 1.0000000

Cara menafsirkan hasilnya adalah sebagai berikut:

  • Korelasi antara a dan b sebesar 0,9279869.
  • Korelasi antara a dan c sebesar 0,9604329.
  • Korelasi antara b dan c sebesar 0,8942139.

Contoh 3: Korelasi antar semua variabel

Kode berikut menunjukkan cara menghitung korelasi antara semua variabel dalam bingkai data:

 cor(df)

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

Contoh 4: Korelasi antara variabel numerik saja

Kode berikut menunjukkan cara menghitung korelasi antara variabel numerik saja dalam bingkai data:

 cor(df[, unlist ( lapply (df, is. numeric ))])

           abcd
a 1.0000000 0.9279869 0.9604329 -0.7915488
b 0.9279869 1.0000000 0.8942139 -0.7917973
c 0.9604329 0.8942139 1.0000000 -0.8063549
d -0.7915488 -0.7917973 -0.8063549 1.0000000

Contoh 5: Memvisualisasikan korelasi

Kode berikut menunjukkan cara membuat plot berpasangan – jenis plot yang memungkinkan Anda memvisualisasikan hubungan antara setiap kombinasi variabel berpasangan:

 #load psych package
library(psych)

#create pairs plot
peers. panels (df)

Sumber daya tambahan

Cara menghitung korelasi parsial di R
Cara menghitung korelasi titik-biserial di R
Cara menghitung korelasi geser di R

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *