Apa yang dianggap “kuat”; korelasi?


Dalam statistik, kita sering kali berusaha memahami bagaimana dua variabel berhubungan satu sama lain. Misalnya, kita mungkin ingin mengetahui:

  • Apa hubungan antara jumlah jam belajar siswa dan nilai ujiannya?
  • Apa hubungan antara suhu luar dan jumlah es krim yang dijual truk makanan?
  • Apa hubungan antara dana pemasaran yang dikeluarkan dan total pendapatan yang diperoleh untuk bisnis tertentu?

Dalam setiap skenario ini, kami mencoba memahami hubungan antara dua variabel berbeda.

Dalam statistik, salah satu cara paling umum untuk mengukur hubungan antara dua variabel adalah dengan menggunakan koefisien korelasi Pearson , yang merupakan ukuran hubungan linier antara dua variabel . Ini memiliki nilai antara -1 dan 1 di mana:

  • -1 menunjukkan korelasi linier negatif sempurna antara dua variabel
  • 0 menunjukkan tidak ada korelasi linier antara dua variabel
  • Angka 1 menunjukkan korelasi linier positif sempurna antara dua variabel

Sering dilambangkan r , angka ini membantu kita memahami kekuatan hubungan antara dua variabel. Semakin jauh r dari nol maka semakin kuat hubungan kedua variabel tersebut .

Penting untuk diperhatikan bahwa dua variabel dapat memiliki korelasi positif yang kuat atau korelasi negatif yang kuat.

Korelasi positif yang kuat: Ketika nilai satu variabel meningkat, nilai variabel lainnya juga meningkat dengan cara yang sama. Misalnya, semakin banyak jam yang dihabiskan seorang siswa untuk belajar, cenderung semakin tinggi pula nilai ujiannya. Jumlah jam belajar dan nilai ujian mempunyai korelasi positif yang kuat.

Korelasi negatif kuat: ketika nilai salah satu variabel meningkat maka nilai variabel lainnya cenderung menurun. Misalnya, semakin tua seekor ayam, semakin sedikit telur yang dihasilkannya. Umur ayam dan produksi telur memiliki korelasi negatif yang kuat.

Tabel berikut menunjukkan aturan praktis untuk menafsirkan kekuatan hubungan dua variabel berdasarkan nilai r :

Nilai mutlak r Kekuatan hubungan
r <0,25 Tidak ada hubungan
0,25 < r < 0,5 Hubungan yang lemah
0,5 < r < 0,75 Hubungan yang moderat
r > 0,75 Hubungan yang kuat

Korelasi antara dua variabel dikatakan kuat jika nilai absolut r lebih besar dari 0,75 . Namun, definisi korelasi “kuat” dapat bervariasi dari satu bidang ke bidang lainnya.

Medis

Misalnya, dalam bidang medis, definisi hubungan “kuat” seringkali jauh lebih rendah. Jika hubungan antara meminum obat tertentu dan mengurangi serangan jantung adalah r = 0,3, hal ini mungkin dianggap sebagai hubungan “positif lemah” di bidang lain, namun dalam dunia kedokteran, hubungan ini cukup signifikan sehingga layak untuk mengonsumsi obat guna mengurangi kemungkinan terjadinya serangan jantung. mengalami serangan jantung.

Sumber daya manusia

Di bidang lain seperti sumber daya manusia, korelasi yang lebih rendah juga dapat lebih sering digunakan. Misalnya, korelasi antara nilai perguruan tinggi dan prestasi kerja telah terbukti kira-kira r = 0,16 . Itu cukup rendah, tapi cukup penting sehingga perusahaan setidaknya harus mempertimbangkannya selama proses wawancara.

Teknologi

Dan dalam bidang seperti teknologi, korelasi antar variabel mungkin perlu lebih tinggi dalam beberapa kasus agar bisa dianggap “kuat”. Misalnya, jika sebuah perusahaan menciptakan mobil tanpa pengemudi dan korelasi antara keputusan membelokkan mobil dan kemungkinan terjadinya kecelakaan adalah r = 0,95 , maka hal ini mungkin terlalu rendah untuk dianggap aman karena mobil tersebut merupakan hasil dari pembuatan mobil tanpa pengemudi. mobil tanpa pengemudi adalah r = 0,95. keputusan yang buruk bisa berakibat fatal.

Lihat korelasi

Apa pun bidang pekerjaan Anda, akan sangat membantu jika Anda membuat diagram sebar dari dua variabel yang Anda pelajari sehingga Anda setidaknya dapat memeriksa hubungan di antara keduanya secara visual.

Misalnya, kita memiliki kumpulan data berikut yang menunjukkan tinggi dan berat 12 orang:

Agak sulit memahami hubungan kedua variabel ini hanya dengan melihat data mentahnya. Namun, akan lebih mudah untuk memahami hubungannya jika kita membuat diagram sebar dengan tinggi pada sumbu x dan berat pada sumbu y:

Jelas terdapat hubungan positif antara kedua variabel tersebut.

Membuat point cloud adalah ide bagus karena dua alasan lain:

(1) Plot sebar memungkinkan Anda mengidentifikasi outlier yang memengaruhi korelasi.

Pencilan ekstrim dapat mengubah koefisien korelasi Pearson secara signifikan. Perhatikan contoh di bawah ini, dimana variabel X dan Y mempunyai koefisien korelasi Pearson sebesar r = 0,00 .

Tapi sekarang bayangkan kita memiliki outlier dalam kumpulan data:

Outlier ini menyebabkan korelasinya menjadi r = 0,878 . Titik data tunggal ini benar-benar mengubah korelasi dan membuatnya tampak seolah-olah ada hubungan yang kuat antara variabel X dan Y , padahal sebenarnya tidak ada.

(2) Plot sebar dapat membantu Anda mengidentifikasi hubungan nonlinier antar variabel.

Koefisien korelasi Pearson hanya memberi tahu kita apakah dua variabel berhubungan linier . Namun meskipun koefisien korelasi Pearson menunjukkan bahwa dua variabel tidak berkorelasi, keduanya masih bisa mempunyai hubungan nonlinier. Ini adalah alasan lain mengapa membuat diagram sebar berguna.

Misalnya, perhatikan diagram sebar di bawah ini antara variabel X dan Y , yang korelasinya adalah r = 0,00 .

Variabel-variabelnya jelas tidak memiliki hubungan linier, tetapi memiliki hubungan nonlinier: nilai y hanyalah nilai x yang dikuadratkan. Koefisien korelasi saja tidak dapat mendeteksi hubungan ini, namun plot sebar dapat mendeteksinya.

Kesimpulan

Kesimpulan:

  • Secara umum, korelasi yang lebih besar dari 0,75 dianggap sebagai korelasi yang “kuat” antara dua variabel.
  • Namun, aturan praktis ini dapat berbeda dari satu daerah ke daerah lain. Misalnya, korelasi yang jauh lebih lemah mungkin dianggap kuat dalam bidang medis dibandingkan dengan bidang teknologi. Cara terbaik adalah menggunakan keahlian khusus domain untuk memutuskan apa yang dianggap kuat.
  • Saat menggunakan korelasi untuk mendeskripsikan hubungan antara dua variabel, ada baiknya juga membuat plot sebar sehingga Anda dapat mengidentifikasi outlier dalam kumpulan data serta potensi hubungan nonlinier.

Sumber daya tambahan

Apa yang dianggap sebagai korelasi “lemah”?
Kalkulator Matriks Korelasi
Cara membaca matriks korelasi

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *