Korelasi
Artikel ini menjelaskan pengertian korelasi antara dua variabel, cara menghitung koefisien korelasi, dan berbagai jenis korelasi yang ada. Selain itu juga diperlihatkan bagaimana menginterpretasikan nilai korelasi dua variabel.
Apa itu korelasi?
Korelasi merupakan ukuran statistik yang menunjukkan derajat hubungan antara dua variabel. Lebih spesifiknya, korelasi linier digunakan untuk mengetahui derajat korelasi linier antara dua variabel yang berbeda.
Dua variabel saling berhubungan apabila perubahan nilai suatu variabel juga mengubah nilai variabel lainnya. Misal kenaikan variabel A maka kenaikan variabel B maka terjadi korelasi antara variabel A dan B.
Jenis korelasi
Tergantung pada hubungan antara dua variabel acak, jenis korelasi linier berikut dibedakan:
- Korelasi langsung (atau korelasi positif) : satu variabel meningkat ketika variabel lainnya juga meningkat.
- Korelasi terbalik (atau korelasi negatif) : jika satu variabel meningkat maka variabel lainnya menurun, dan sebaliknya jika satu variabel menurun maka variabel lainnya meningkat.
- Korelasi nol (tidak ada korelasi) : Tidak ada hubungan antara kedua variabel.
Ingatlah bahwa ini adalah berbagai jenis korelasi linier yang ada, namun bisa juga hubungan matematis antara dua variabel tidak dapat direpresentasikan dengan garis lurus, melainkan perlu menggunakan fungsi yang lebih kompleks, seperti perumpamaan. atau logaritma. Dalam hal ini, korelasinya akan menjadi korelasi non-linier .
Koefisien korelasi
Mengingat definisi korelasi dan berbagai jenis korelasi yang ada, mari kita lihat bagaimana nilai statistik ini dihitung.
Koefisien korelasi disebut juga koefisien korelasi linier atau koefisien korelasi Pearson adalah nilai korelasi antara dua variabel.
Koefisien korelasi dua variabel statistik sama dengan hasil bagi antara kovarians variabel dan akar kuadrat hasil kali varians masing-masing variabel. Oleh karena itu rumus menghitung koefisien korelasi adalah sebagai berikut:
Saat menghitung koefisien korelasi pada suatu populasi, simbol korelasinya adalah huruf Yunani ρ. Namun ketika koefisien dihitung relatif terhadap suatu sampel, huruf r biasanya digunakan sebagai simbol.
Nilai indeks korelasi bisa antara -1 dan +1 inklusif. Di bawah ini kita akan melihat bagaimana nilai koefisien korelasi diinterpretasikan.
Contoh konkrit cara menghitung koefisien korelasi dapat Anda lihat pada link berikut:
Perlu diingat bahwa ada jenis koefisien korelasi lain, seperti koefisien korelasi Spearman atau Kendall. Namun yang paling umum tidak diragukan lagi adalah koefisien korelasi Pearson.
Menafsirkan korelasinya
Nilai koefisien korelasi dapat berkisar antara -1 hingga +1 inklusif. Jadi, tergantung dari nilai koefisien korelasinya, berarti hubungan kedua variabel tersebut searah atau searah. Berikut cara mengartikan nilai korelasi :
- r=-1 : kedua variabel mempunyai korelasi negatif sempurna, sehingga kita dapat menarik garis dengan kemiringan negatif yang menghubungkan semua titik.
- -1<r<0 : korelasi kedua variabel bernilai negatif, sehingga jika salah satu variabel meningkat maka variabel lainnya menurun. Semakin dekat nilainya dengan -1, maka variabel-variabel tersebut mempunyai hubungan yang semakin negatif.
- r=0 : korelasi kedua variabel sangat lemah, bahkan hubungan linier keduanya adalah nol. Hal ini tidak berarti bahwa variabel-variabel tersebut independen, karena bisa saja mempunyai hubungan non-linier.
- 0<r<1 : korelasi kedua variabel bernilai positif, semakin mendekati +1 maka semakin kuat hubungan antar variabel. Dalam hal ini, satu variabel cenderung meningkat nilainya ketika variabel lainnya juga meningkat.
- r=1 : kedua variabel mempunyai korelasi positif sempurna, yaitu mempunyai hubungan linier positif.
Seperti yang terlihat pada diagram sebar di atas, semakin kuat korelasi antara dua variabel, semakin rapat titik-titiknya pada grafik. Sebaliknya jika jarak titik-titiknya sangat jauh berarti korelasinya lemah.
Perlu diingat bahwa walaupun ada korelasi antara dua variabel, bukan berarti ada hubungan sebab akibat di antara keduanya, yaitu korelasi antara dua variabel tidak berarti bahwa perubahan pada satu variabel menjadi penyebab perubahan pada variabel yang lain. variabel.
Misalnya, jika kita menemukan adanya hubungan positif antara produksi dua hormon berbeda dalam tubuh, hal ini tidak berarti bahwa peningkatan satu hormon menyebabkan peningkatan hormon lainnya. Bisa jadi tubuh memproduksi kedua hormon tersebut karena memerlukan keduanya untuk melawan suatu penyakit dan oleh karena itu meningkatkan kadar keduanya secara bersamaan, dalam hal ini penyebabnya adalah penyakit tersebut. Untuk mengetahui apakah terdapat hubungan sebab akibat antara kedua hormon tersebut, perlu dilakukan penelitian yang lebih detail.
Korelasi dan regresi
Korelasi dan regresi adalah dua konsep yang umumnya terkait, karena keduanya digunakan untuk menganalisis hubungan antara dua variabel.
Korelasi adalah ukuran statistik yang mengukur hubungan antara dua variabel, namun regresi melibatkan pembuatan persamaan (jika regresi linier akan berbentuk garis lurus) yang memungkinkan kedua variabel saling berhubungan.
Jadi, korelasi hanya memberikan nilai numerik pada hubungan antar variabel, sedangkan regresi dapat digunakan untuk mencoba memprediksi nilai suatu variabel relatif terhadap variabel lainnya.
Umumnya kita menganalisis terlebih dahulu apakah suatu variabel berkorelasi dengan menghitung koefisien korelasinya. Dan jika korelasinya signifikan, maka kami menjalankan regresi pada kumpulan data tersebut.
Koefisien korelasi sering dikacaukan dengan nilai kemiringan garis yang diperoleh dalam regresi linier, namun keduanya tidak setara.
Matriks korelasi
Matriks korelasi adalah matriks yang pada posisi i,j memuat koefisien korelasi antara variabel i dan j .
Oleh karena itu, matriks korelasi adalah matriks persegi yang diisi dengan matriks pada diagonal utama dan elemen baris i dan kolom j terdiri dari nilai koefisien korelasi antara variabel i dan variabel j .
Jadi rumus matriks korelasinya adalah sebagai berikut:
Emas
adalah koefisien korelasi antar variabel
Dan
Matriks korelasi sangat berguna untuk merangkum hasil dan membandingkan korelasi antara beberapa variabel sekaligus, karena Anda dapat dengan cepat melihat hubungan mana yang kuat.