R'de polikorik korelasyon nasıl hesaplanır
Sıralı değişkenler arasındaki korelasyonu hesaplamak için polikorik korelasyon kullanılır.
Sıralı değişkenlerin, olası değerleri kategorik olan ve doğal bir sıraya sahip olan değişkenler olduğunu hatırlayın.
Sıralı ölçekte ölçülen değişkenlere bazı örnekler:
- Memnuniyet : Hiç memnun değilim, memnun değilim, nötr, memnunum, çok memnunum
- Gelir düzeyi : Düşük gelir, orta gelir, yüksek gelir
- İşin Konumu Durumu : Giriş Analisti, Analist I, Analist II, Kıdemli Analist
- Ağrı düzeyi : Düşük miktar, orta miktar, yüksek miktar
Polikorik korelasyonun değeri -1 ila 1 arasında değişir; burada:
- -1 mükemmel negatif korelasyonu gösterir
- 0 korelasyon olmadığını gösterir
- 1 mükemmel bir pozitif korelasyonu gösterir
R’deki iki sıralı değişken arasındaki polikorik korelasyonu hesaplamak için polycor paketindeki polychor(x, y) fonksiyonunu kullanabiliriz.
Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: Film Derecelendirmeleri için Polikorik Korelasyonun Hesaplanması
Diyelim ki iki farklı film derecelendirme kuruluşunun film derecelendirmeleri arasında yüksek bir korelasyon olup olmadığını bilmek istiyorsunuz.
Her ajanstan 20 farklı filmi 1’den 3’e kadar derecelendirmesini istiyoruz:
- 1 “kötü”yü gösterir
- 2 “zayıf”ı gösterir
- 3 “iyi”yi gösterir
İki ajansın derecelendirmeleri arasındaki polikorik korelasyonu hesaplamak için R’de aşağıdaki kodu kullanabiliriz:
library (polycor) #define movie ratings for each agency agency1 <- c(1, 1, 2, 2, 3, 2, 2, 3, 2, 3, 3, 2, 1, 2, 2, 1, 1, 1, 2, 2) agency2 <- c(1, 1, 2, 1, 3, 3, 3, 2, 2, 3, 3, 3, 2, 2, 2, 1, 2, 1, 3, 3) #calculate polychoric correlation between ratings polychor(agency1, agency2) [1] 0.7828328
Polikorik korelasyon 0,78 olarak ortaya çıkıyor.
Bu değer oldukça yüksektir ve her ajansın derecelendirmeleri arasında güçlü bir pozitif ilişki olduğunu göstermektedir.
Örnek 2: Restoran incelemeleri için polikorik korelasyonu hesaplayın
Diyelim ki iki farklı mahalle restoranının, restoranlarına ilişkin müşteri puanları arasında bir korelasyon olup olmadığını bilmek istiyorsunuz.
İki restoranda yemek yiyen 20 müşteriyle rastgele anket yapıyoruz ve onlardan genel memnuniyetlerini 1’den 5’e kadar bir ölçekte derecelendirmelerini istiyoruz:
- 1 “hiç memnun değilim” anlamına gelir
- 2 “memnun değilim” anlamına gelir
- 3 “nötr” anlamına gelir
- 4 “memnun” olduğunu gösterir
- 5 “çok memnunum” anlamına gelir
İki restoranın derecelendirmeleri arasındaki polikorik korelasyonu hesaplamak için R’de aşağıdaki kodu kullanabiliriz:
library (polycor) #define ratings for each restaurant restaurant1 <- c(1, 1, 2, 2, 2, 3, 3, 3, 2, 2, 3, 4, 4, 5, 5, 4, 3, 4, 5, 5) restaurant2 <- c(4, 3, 3, 4, 3, 3, 4, 5, 4, 4, 4, 5, 5, 4, 2, 1, 1, 2, 1, 4) #calculate polychoric correlation between ratings polychor(restaurant1, restaurant2) [1] -0.1322774
Polikorik korelasyon -0,13 olarak ortaya çıkıyor.
Bu değerin sıfıra yakın olması, restoran derecelendirmeleri arasında (eğer varsa) çok az ilişki olduğunu gösterir.
Ek kaynaklar
Aşağıdaki eğitimlerde R’deki diğer ortak korelasyon katsayılarının nasıl hesaplanacağı açıklanmaktadır:
R’de Spearman sıralama korelasyonu nasıl hesaplanır
R’de nokta-çift serili korelasyon nasıl hesaplanır
R’de çapraz korelasyon nasıl hesaplanır
R’de kayan korelasyon nasıl hesaplanır
R’de kısmi korelasyon nasıl hesaplanır