Lima hipotesis korelasi pearson


Koefisien korelasi Pearson (juga dikenal sebagai “koefisien korelasi momen produk”) mengukur hubungan linier antara dua variabel.

Itu selalu mengambil nilai antara -1 dan 1 di mana:

  • -1 menunjukkan korelasi linier negatif sempurna antara dua variabel
  • 0 menunjukkan tidak ada korelasi linier antara dua variabel
  • Angka 1 menunjukkan korelasi linier positif sempurna antara dua variabel

Namun, sebelum menghitung koefisien korelasi Pearson antara dua variabel, kita harus memastikan bahwa lima asumsi terpenuhi:

1. Tingkat pengukuran: Kedua variabel harus diukur pada tingkat interval atau rasio .

2. Hubungan linier : Harus ada hubungan linier antara kedua variabel.

3. Normalitas: kedua variabel harus mempunyai distribusi mendekati normal.

4. Pasangan terkait: Setiap observasi dalam kumpulan data harus memiliki sepasang nilai.

5. Tidak ada outlier: Tidak boleh ada outlier ekstrim dalam kumpulan data.

Pada artikel ini kami memberikan penjelasan masing-masing asumsi serta cara menentukan apakah asumsi tersebut terpenuhi.

Hipotesis 1: Tingkat pengukuran

Untuk menghitung koefisien korelasi Pearson antara dua variabel, kedua variabel harus diukur pada tingkat interval atau rasio .

Grafik berikut memberikan penjelasan singkat tentang empat tingkatan di mana variabel dapat diukur:

Berikut beberapa contoh variabel yang dapat diukur dalam skala interval :

  • Suhu: Diukur dalam Fahrenheit atau Celsius
  • Nilai kredit: diukur dari 300 hingga 850
  • Skor SAT: diukur dari 400 hingga 1.600

Berikut beberapa contoh variabel yang dapat diukur dengan skala rasio :

  • Tinggi: Diukur dalam sentimeter, inci, kaki, dll.
  • Berat: diukur dalam kilogram, pon, dll.
  • Panjang: Diukur dalam sentimeter, inci, kaki, dll.

Jika variabel diukur pada tingkat ordinal , maka Anda perlu menghitung koefisien korelasi Spearman di antara variabel tersebut.

Terkait: Tingkatan Pengukuran: Nominal, Ordinal, Interval, dan Rasio

Hipotesis 2: Hubungan linier

Untuk menghitung koefisien korelasi Pearson antara dua variabel, harus ada hubungan linier antara kedua variabel.

Cara termudah untuk menguji hipotesis ini adalah dengan membuat diagram sebar kedua variabel. Jika titik-titik pada plot kira-kira mengikuti garis lurus, maka terdapat hubungan linier:

Namun, jika titik-titik tersebut tersebar secara acak di seluruh plot atau memiliki jenis hubungan lain (seperti kuadrat), maka tidak ada hubungan linier antar variabel:

Dalam hal ini, koefisien korelasi Pearson tidak akan cukup menggambarkan hubungan antar variabel.

Hipotesis 3: normalitas

Koefisien korelasi Pearson juga mengasumsikan bahwa kedua variabel tersebut berdistribusi normal .

Anda dapat memverifikasi asumsi ini secara visual dengan membuat histogram atau plot QQ untuk setiap variabel.

1. Histogram

Jika histogram suatu kumpulan data kira-kira berbentuk lonceng, kemungkinan besar data tersebut terdistribusi secara normal.

2. Tanah QQ

Plot QQ, kependekan dari “quantile-quantile”, adalah jenis plot yang menampilkan kuantil teoretis di sepanjang sumbu x (yaitu lokasi data Anda jika mengikuti distribusi normal) dan kuantil sampel di sepanjang sumbu y. (yaitu di mana data Anda sebenarnya berada).

Jika nilai data mengikuti garis kira-kira lurus membentuk sudut 45 derajat, maka data dianggap berdistribusi normal.

Anda juga dapat melakukan uji statistik formal untuk menentukan apakah suatu variabel terdistribusi normal.

Jika nilai p tes berada di bawah tingkat signifikansi tertentu (misalnya α = 0,05), maka Anda mempunyai cukup bukti untuk mengatakan bahwa data tidak terdistribusi normal.

Ada tiga uji statistik yang biasa digunakan untuk menguji normalitas:

1. Tes Jarque-Bera

2. Tes Shapiro-Wilk

3. Tes Kolmogorov-Smirnov

Hipotesis 4: Pasangan yang berkerabat

Koefisien korelasi Pearson juga mengasumsikan bahwa setiap observasi dalam kumpulan data harus memiliki sepasang nilai.

Hipotesis ini mudah untuk diverifikasi. Misalnya, jika Anda menghitung korelasi antara berat badan dan tinggi badan, cukup verifikasi bahwa setiap observasi dalam kumpulan data memiliki ukuran berat badan dan ukuran tinggi badan.

Hipotesis 5: Tidak ada outlier

Koefisien korelasi Pearson juga mengasumsikan tidak terdapat outlier yang ekstrim pada kumpulan data, karena outlier sangat mempengaruhi penghitungan koefisien korelasi.

Untuk mengilustrasikannya, pertimbangkan kumpulan data berikut:

Koefisien korelasi Pearson antara X dan Y sebesar 0,949 .

Namun, misalkan kita memiliki outlier dalam kumpulan data:

Koefisien korelasi Pearson antara X dan Y sekarang adalah 0,711 .

Pencilan secara signifikan mengubah koefisien korelasi Pearson antara kedua variabel. Dalam hal ini, mungkin masuk akal untuk menghapus outlier dari kumpulan data.

Terkait: Panduan Lengkap: Kapan Menghapus Pencilan dalam Data

Sumber daya tambahan

Tutorial berikut memberikan informasi tambahan tentang korelasi Pearson:

Pengantar Koefisien Korelasi Pearson
Cara melaporkan korelasi Pearson dalam format APA
Cara Menghitung Koefisien Korelasi Pearson Secara Manual

Tambahkan komentar

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *