Apa yang dianggap “lemah”; korelasi?


Dalam statistik, kita sering kali berusaha memahami bagaimana dua variabel berhubungan satu sama lain. Misalnya, kita mungkin ingin mengetahui:

  • Apa hubungan antara jumlah jam belajar siswa dan nilai ujiannya?
  • Apa hubungan antara suhu luar dan jumlah es krim batangan yang dijual oleh truk makanan?
  • Apa hubungan antara uang yang dibelanjakan untuk iklan dan total pendapatan yang diperoleh bisnis tertentu?

Dalam setiap skenario, kami ingin memahami hubungan antara dua variabel.

Salah satu cara paling umum untuk mengukur hubungan antara dua variabel adalah dengan menggunakan koefisien korelasi Pearson , yang merupakan ukuran hubungan linier antara dua variabel.

Itu selalu mengambil nilai antara -1 dan 1 di mana:

  • -1 menunjukkan korelasi linier negatif sempurna antara dua variabel
  • 0 menunjukkan tidak ada korelasi linier antara dua variabel
  • Angka 1 menunjukkan korelasi linier positif sempurna antara dua variabel

Sering dilambangkan r , angka ini membantu kita memahami kekuatan hubungan antara dua variabel. Semakin dekat r ke nol maka semakin lemah hubungan kedua variabel tersebut .

Penting untuk dicatat bahwa dua variabel dapat memiliki korelasi positif yang lemah atau korelasi negatif yang lemah.

Korelasi positif lemah: Ketika satu variabel meningkat, variabel lainnya cenderung meningkat juga, namun hanya lemah atau tidak dapat diandalkan.

Contoh korelasi positif lemah

Korelasi negatif rendah: Ketika satu variabel meningkat, variabel lainnya cenderung menurun, namun hanya lemah atau tidak dapat diandalkan.

Contoh korelasi negatif yang lemah

Tabel berikut menunjukkan aturan praktis untuk menafsirkan kekuatan hubungan dua variabel berdasarkan nilai r :

Nilai mutlak r Kekuatan hubungan
r <0,25 Tidak ada hubungan
0,25 < r < 0,5 Hubungan yang lemah
0,5 < r < 0,75 Hubungan yang moderat
r > 0,75 Hubungan yang kuat

Korelasi antara dua variabel dianggap rendah jika nilai absolut r antara 0,25 dan 0,5.

Namun, definisi korelasi “lemah” dapat bervariasi dari satu bidang ke bidang lainnya.

Medis

Dalam bidang medis, definisi hubungan “lemah” seringkali jauh lebih rendah. Jika hubungan antara penggunaan obat tertentu dan penurunan serangan jantung adalah r = 0,2, hal ini mungkin dianggap “tidak ada hubungan” di bidang lain, namun dalam dunia kedokteran hal ini cukup signifikan sehingga layak untuk meminum obat tersebut untuk mengurangi risiko serangan jantung. . mengalami serangan jantung.

Sumber daya manusia

Dalam bidang seperti sumber daya manusia, korelasi yang lebih rendah juga lebih sering digunakan. Misalnya, korelasi antara IPK perguruan tinggi dan prestasi kerja telah terbukti kira-kira r = 0,16 . Itu cukup rendah, tapi cukup penting sehingga perusahaan setidaknya harus mempertimbangkannya selama proses wawancara.

Teknologi

Di bidang teknologi, korelasi antar variabel mungkin perlu lebih tinggi agar bisa dianggap “rendah”. Misalnya, jika sebuah perusahaan menciptakan mobil tanpa pengemudi dan korelasi antara keputusan membelokkan mobil dan kemungkinan menghindari kecelakaan adalah r = 0,95 , hal ini dapat dianggap sebagai korelasi yang “lemah” dan mungkin terlalu lemah bagi mobil tersebut untuk melakukannya. dianggap aman, karena salah mengambil keputusan bisa berakibat fatal.

Gunakan plot sebar untuk memvisualisasikan korelasi

Saat menghitung koefisien korelasi antara dua variabel, ada gunanya membuat diagram sebar untuk memvisualisasikan korelasinya juga.

Secara khusus, point cloud menawarkan dua keuntungan:

1. Scatterplots dapat membantu Anda mengidentifikasi outlier yang mempengaruhi koefisien korelasi.

Pencilan yang ekstrim dapat berdampak besar pada koefisien korelasi. Perhatikan contoh di bawah ini, dimana variabel X dan Y memiliki koefisien korelasi Pearson sebesar r = 0,91 .

Sekarang bayangkan kita mengubah titik data pertama menjadi lebih besar. Koefisien korelasi tiba-tiba menjadi r = 0,29 .

Titik data tunggal ini mengubah koefisien korelasi dari hubungan positif kuat menjadi hubungan positif lemah.

(2) Scatterplots dapat membantu Anda mengidentifikasi hubungan nonlinier antar variabel.

Koefisien korelasi Pearson hanya memberi tahu kita apakah dua variabel berhubungan linier . Bahkan jika koefisien korelasi Pearson menunjukkan bahwa dua variabel tidak berkorelasi, keduanya masih mempunyai hubungan nonlinier.

Misalnya, perhatikan diagram sebar di bawah ini antara variabel X dan Y , yang korelasinya adalah r = 0,00 .

Variabel-variabelnya jelas tidak memiliki hubungan linier, tetapi memiliki hubungan nonlinier: nilai y hanyalah nilai x yang dikuadratkan.

Koefisien korelasi saja tidak dapat mendeteksi hubungan ini, namun plot sebar dapat mendeteksinya.

Kesimpulan

Kesimpulan:

1. Umumnya, koefisien korelasi antara 0,25 dan 0,5 dianggap sebagai korelasi “lemah” antara dua variabel.

2. Aturan praktis ini mungkin berbeda dari satu daerah ke daerah lain. Misalnya, korelasi yang jauh lebih rendah mungkin dianggap lemah dalam bidang medis dibandingkan dengan bidang teknologi. Pastikan untuk menggunakan keahlian subjek Anda untuk memutuskan apa yang dianggap korelasi rendah.

3. Saat menggunakan koefisien korelasi untuk menggambarkan hubungan antara dua variabel, ada baiknya juga membuat plot sebar sehingga Anda dapat mengidentifikasi outlier dalam kumpulan data serta potensi hubungan nonlinier.

Sumber daya tambahan

Apa yang dianggap sebagai korelasi “kuat”?
Kalkulator Matriks Korelasi
Korelasi vs. asosiasi: apa bedanya?

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *