Sürekli ve kategorik değişkenler arasındaki korelasyon nasıl hesaplanır?


İki sürekli değişken arasındaki korelasyonu hesaplamak istediğimizde genellikle Pearson korelasyon katsayısını kullanırız.

Ancak sürekli bir değişken ile kategorik bir değişken arasındaki korelasyonu hesaplamak istediğimizde nokta çift serili korelasyon denilen yöntemi kullanabiliriz.

Nokta çift serili korelasyon, ikili kategorik bir değişken (yalnızca iki değer alabilen bir değişken) ile sürekli bir değişken arasındaki korelasyonu hesaplamak için kullanılır ve aşağıdaki özelliklere sahiptir:

  • Nokta-çift serili korelasyon -1 ile 1 arasında değişebilir.
  • İkili değişkenin oluşturduğu her grup için sürekli değişkenin eşit varyanslarla normal dağıldığı varsayılır.
  • İkili değişken tarafından oluşturulan her grup için aşırı aykırı değerlerin olmadığı varsayılır.

Aşağıdaki örnek, pratikte nokta-çift serili korelasyonun nasıl hesaplanacağını gösterir.

Örnek: Nokta-çift serili korelasyonun hesaplanması

Bir üniversite profesörünün belirli bir yeterlilik sınavında cinsiyet ile puan arasında bir ilişki olup olmadığını belirlemek istediğini varsayalım.

Sınıfındaki 12 erkek ve 12 kız hakkında aşağıdaki verileri topluyor:

Cinsiyet kategorik bir değişken ve puan sürekli bir değişken olduğundan, iki değişken arasında nokta-çift serili bir korelasyonun hesaplanması mantıklıdır.

Profesör, iki değişken arasındaki nokta-çift serili korelasyonu hesaplamak için herhangi bir istatistiksel yazılımı (Excel, R, Python, SPSS, Stata dahil) kullanabilir.

Aşağıdaki kod, cinsiyet değişkeni için kadınları temsil etmek için 0 ve erkekleri temsil etmek için 1 değerini kullanarak R’de nokta çift serili korelasyonun nasıl hesaplanacağını gösterir:

 #define values for gender
gender <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
            1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1)

#define values for score
score <- c(77, 78, 79, 79, 82, 84, 85, 88, 89, 91, 91, 94,
           84, 84, 84, 85, 85, 86, 86, 86, 89, 91, 94, 98)

#calculate point-biserial correlation
horn. test (gender, score)

	Pearson's product-moment correlation

data: gender and score
t = 1.3739, df = 22, p-value = 0.1833
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 -0.1379386 0.6147832
sample estimates:
      horn 
0.2810996

Sonuçtan nokta-çift serili korelasyon katsayısının 0,281 ve karşılık gelen p değerinin 0,1833 olduğunu görebiliriz.

Korelasyon katsayısının pozitif olması bize cinsiyet ile puan arasında pozitif bir ilişki olduğunu göstermektedir.

Erkekleri 1, kadınları 0 olarak kodladığımız için bu, puanların erkeklerde daha yüksek olduğunu göstermektedir (yani cinsiyet “artıkça” puanlar da artma eğilimindedir). » 0’dan 1’e).

Ancak p değeri 0,05’ten küçük olmadığından bu korelasyon katsayısı istatistiksel olarak anlamlı değildir.

Ek kaynaklar

Aşağıdaki eğitimlerde farklı istatistiksel yazılımlar kullanılarak nokta çift serili korelasyonun nasıl hesaplanacağı açıklanmaktadır:

Excel’de nokta-çift serili korelasyon nasıl hesaplanır
R’de nokta-çift serili korelasyon nasıl hesaplanır
Python’da nokta-çift serili korelasyon nasıl hesaplanır

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir