R'de çift grafikler nasıl oluşturulur ve yorumlanır
Çift grafiği, bir veri kümesindeki farklı değişkenler arasındaki ikili ilişkiyi anlamanıza olanak tanıyan bir dağılım grafiği matrisidir.
Neyse ki, Pairs() işlevini kullanarak R’de bir çiftler grafiği oluşturmak kolaydır. Bu eğitimde bu işlevin pratik kullanımına ilişkin çeşitli örnekler verilmektedir.
Örnek 1: Tüm Değişkenlerin Çift Grafiği
Aşağıdaki kod, R’deki bir veri çerçevesindeki tüm değişkenler için bir baz çifti grafiğinin nasıl oluşturulacağını gösterir:
#make this example reproducible set.seed(0) #create data frame var1 <- rnorm(1000) var2 <- var1 + rnorm(1000, 0, 2) var3 <- var2 - rnorm(1000, 0, 5) df <- data.frame(var1, var2, var3) #create pairs plot peers(df)
Matrisin yorumlanma şekli şu şekildedir:
- Değişken adları çapraz kutular boyunca görüntülenir.
- Diğer tüm kutular, değişkenlerin ikili kombinasyonlarının her biri arasındaki ilişkinin dağılım grafiğini görüntüler. Örneğin, matrisin sağ üst köşesindeki alan var1 ve var3 değerlerinin dağılım grafiğini görüntüler. Sol ortadaki kutu, var1 ve var2 vb. için değerlerin dağılım grafiğini görüntüler.
Bu tek grafik bize veri setimizdeki her bir değişken çifti arasındaki ilişki hakkında fikir verir. Örneğin, var1 ve var2 pozitif korelasyonlu gibi görünürken var1 ve var3’ün çok az korelasyonu var veya hiç korelasyonu yok gibi görünüyor.
Örnek 2: Belirli Değişken Çiftlerinin Çizilmesi
Aşağıdaki kod, bir veri kümesindeki yalnızca ilk iki değişken için baz çifti grafiğinin nasıl oluşturulacağını gösterir:
#create pairs plot for var1 and var2 only
even(df[, 1:2])
Örnek 3: Çift grafiğinin estetiğini değiştirme
Aşağıdaki kod, başlık, renk ve etiketler de dahil olmak üzere çiftler grafiğinin estetiğinin nasıl değiştirileceğini gösterir:
peers(df, col = ' blue ', #modify color labels = c(' First ', ' Second ', ' Third '), #modify labels main = ' Custom Title ') #modify title
Örnek 4: ggpair’lerle korelasyonların elde edilmesi
Ayrıca GGally kütüphanesindeki ggpairs() fonksiyonunu kullanarak değişkenler arasındaki Pearson korelasyon katsayısını da alabilirsiniz. Aşağıdaki kod bu işlevin nasıl kullanılacağını gösterir:
#install necessary libraries install.packages('ggplot2') install.packages('GGally') #load libraries library(ggplot2) library(GGally) #create pairs plot ggpairs(df)
Bu matrisi yorumlamanın yolu şu şekildedir:
- Değişken adları matrisin dış kenarlarında görüntülenir.
- Köşegenler boyunca yer alan kutular, her değişken için yoğunluk grafiğini gösterir.
- Sol alt köşedeki kutular, her değişken arasındaki dağılım grafiğini gösterir.
- Sağ üst köşedeki kutular, her değişken arasındaki Pearson korelasyon katsayısını gösterir. Örneğin var1 ile var2 arasındaki korelasyon 0,425’tir .
Temel R çiftleri() işlevine göre ggpairs() kullanmanın avantajı, değişkenler hakkında daha fazla bilgi alabilmenizdir. Spesifik olarak, değişkenlerin her ikili kombinasyonu arasındaki korelasyon katsayısını ve ayrıca her bir değişken için yoğunluk grafiğini görebilirsiniz.
ggpairs() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.