Pearson korelasyonunun beş hipotezi


Pearson korelasyon katsayısı (“moment-çarpım korelasyon katsayısı” olarak da bilinir) iki değişken arasındaki doğrusal ilişkiyi ölçer.

Her zaman -1 ile 1 arasında bir değer alır; burada:

  • -1, iki değişken arasında tamamen negatif bir doğrusal korelasyonu gösterir
  • 0, iki değişken arasında doğrusal bir korelasyon olmadığını gösterir
  • 1, iki değişken arasında mükemmel pozitif doğrusal bir korelasyonu gösterir

Ancak iki değişken arasındaki Pearson korelasyon katsayısını hesaplamadan önce beş varsayımın karşılandığından emin olmalıyız:

1. Ölçüm düzeyi: Her iki değişken de aralık veya oran düzeyinde ölçülmelidir.

2. Doğrusal ilişki: İki değişken arasında doğrusal bir ilişki olmalıdır.

3. Normallik: Her iki değişkenin de yaklaşık olarak normal dağılıma sahip olması gerekir.

4. İlgili çiftler: Veri setindeki her gözlemin bir değer çifti olması gerekir.

5. Aykırı değerlerin olmaması: Veri setinde aşırı uç değerler olmamalıdır.

Bu makalede, her bir varsayımın açıklanmasının yanı sıra, varsayımın karşılanıp karşılanmadığının nasıl belirleneceği de açıklanmaktadır.

Hipotez 1: Ölçüm düzeyi

İki değişken arasındaki Pearson korelasyon katsayısını hesaplamak için her iki değişkenin de aralık veya oran düzeyinde ölçülmesi gerekir.

Aşağıdaki grafik, değişkenlerin ölçülebileceği dört seviyenin hızlı bir açıklamasını sağlar:

Aralık ölçeğinde ölçülebilen bazı değişken örnekleri şunlardır:

  • Sıcaklık: Fahrenheit veya Celsius cinsinden ölçülür
  • Kredi puanları: 300’den 850’ye kadar ölçüldü
  • SAT puanları: 400’den 1.600’e kadar ölçüldü

Oran ölçeğinde ölçülebilen değişkenlere bazı örnekler:

  • Yükseklik: Santimetre, inç, fit vb. cinsinden ölçülür.
  • Ağırlık: kilogram, pound vb. cinsinden ölçülür.
  • Uzunluk: Santimetre, inç, fit vb. cinsinden ölçülür.

Değişkenler sıralı düzeyde ölçülüyorsa, aralarındaki Spearman korelasyon katsayısını hesaplamanız gerekir.

İlgili: Ölçüm Düzeyleri: Nominal, Sıralı, Aralık ve Oran

Hipotez 2: Doğrusal ilişki

İki değişken arasındaki Pearson korelasyon katsayısını hesaplamak için iki değişken arasında doğrusal bir ilişki olması gerekir.

Bu hipotezi test etmenin en kolay yolu, iki değişkenin dağılım grafiğini oluşturmaktır. Grafikteki noktalar yaklaşık olarak düz bir çizgiyi takip ediyorsa, doğrusal bir ilişki vardır:

Bununla birlikte, noktalar çizim boyunca rastgele dağılmışsa veya başka türde bir ilişkiye (ikinci dereceden gibi) sahipse, değişkenler arasında doğrusal bir ilişki mevcut değildir:

Bu durumda Pearson korelasyon katsayısı değişkenler arasındaki ilişkiyi yeterince yakalayamayacaktır.

Hipotez 3: normallik

Pearson korelasyon katsayısı ayrıca iki değişkenin yaklaşık olarak normal dağıldığını varsayar.

Her değişken için bir histogram veya QQ grafiği oluşturarak bu varsayımı görsel olarak doğrulayabilirsiniz.

1. Histogram

Bir veri kümesinin histogramı kabaca çan şeklindeyse, verilerin normal şekilde dağılması muhtemeldir.

2.QQLand

QQ grafiği, “yüzdelik-yüzdelik” kelimesinin kısaltmasıdır, x ekseni boyunca teorik yüzdelik dilimleri (yani, normal bir dağılım izleseydi verilerinizin olacağı yer) ve y ekseni boyunca örneklerin yüzdelik dilimlerini görüntüleyen bir grafik türüdür. (yani verilerinizin gerçekte bulunduğu yer).

Veri değerleri 45 derecelik bir açı oluşturan kabaca düz bir çizgi izliyorsa verilerin normal dağıldığı varsayılır.

Bir değişkenin normal şekilde dağılıp dağılmadığını belirlemek için resmi bir istatistiksel test de yapabilirsiniz.

Testin p değeri belirli bir anlamlılık düzeyinin altındaysa (α = 0,05 gibi), bu durumda verilerin normal dağılmadığını söylemek için yeterli kanıtınız vardır.

Normalliği test etmek için yaygın olarak kullanılan üç istatistiksel test vardır:

1. Jarque-Bera testi

2. Shapiro-Wilk testi

3. Kolmogorov-Smirnov testi

Hipotez 4: İlgili çiftler

Pearson korelasyon katsayısı aynı zamanda veri setindeki her gözlemin bir çift değere sahip olması gerektiğini de varsayar.

Bu hipotezin doğrulanması kolaydır. Örneğin, ağırlık ve boy arasındaki korelasyonu hesaplıyorsanız, veri kümesindeki her gözlemin bir ağırlık ve boy ölçüsüne sahip olduğunu doğrulamanız yeterlidir.

Hipotez 5: Aykırı değer yok

Bir Pearson korelasyon katsayısı aynı zamanda veri setinde aşırı aykırı değerlerin olmadığını da varsayar çünkü aykırı değerler korelasyon katsayısının hesaplanmasını güçlü bir şekilde etkiler.

Bunu göstermek için aşağıdaki veri kümesini göz önünde bulundurun:

X ve Y arasındaki Pearson korelasyon katsayısı 0,949’dur .

Ancak veri kümesinde bir aykırı değerin olduğunu varsayalım:

X ve Y arasındaki Pearson korelasyon katsayısı artık 0,711’dir .

Bir aykırı değer, iki değişken arasındaki Pearson korelasyon katsayısını önemli ölçüde değiştirir. Bu durumda aykırı değerin veri kümesinden kaldırılması mantıklı olabilir.

İlgili: Tam Kılavuz: Verilerdeki Aykırı Değerler Ne Zaman Kaldırılmalı

Ek kaynaklar

Aşağıdaki eğitimler Pearson korelasyonu hakkında ek bilgi sağlar:

Pearson Korelasyon Katsayısına Giriş
Pearson korelasyonu APA formatında nasıl raporlanır?
Pearson Korelasyon Katsayısını Manuel Olarak Hesaplama

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir