R'de çift grafikler nasıl oluşturulur ve yorumlanır


Çift grafiği, bir veri kümesindeki farklı değişkenler arasındaki ikili ilişkiyi anlamanıza olanak tanıyan bir dağılım grafiği matrisidir.

Neyse ki, Pairs() işlevini kullanarak R’de bir çiftler grafiği oluşturmak kolaydır. Bu eğitimde bu işlevin pratik kullanımına ilişkin çeşitli örnekler verilmektedir.

Örnek 1: Tüm Değişkenlerin Çift Grafiği

Aşağıdaki kod, R’deki bir veri çerçevesindeki tüm değişkenler için bir baz çifti grafiğinin nasıl oluşturulacağını gösterir:

 #make this example reproducible 
set.seed(0)

#create data frame 
var1 <- rnorm(1000)
var2 <- var1 + rnorm(1000, 0, 2)
var3 <- var2 - rnorm(1000, 0, 5)
 
df <- data.frame(var1, var2, var3)

#create pairs plot 
peers(df) 

Matrisin yorumlanma şekli şu şekildedir:

  • Değişken adları çapraz kutular boyunca görüntülenir.
  • Diğer tüm kutular, değişkenlerin ikili kombinasyonlarının her biri arasındaki ilişkinin dağılım grafiğini görüntüler. Örneğin, matrisin sağ üst köşesindeki alan var1 ve var3 değerlerinin dağılım grafiğini görüntüler. Sol ortadaki kutu, var1 ve var2 vb. için değerlerin dağılım grafiğini görüntüler.

Bu tek grafik bize veri setimizdeki her bir değişken çifti arasındaki ilişki hakkında fikir verir. Örneğin, var1 ve var2 pozitif korelasyonlu gibi görünürken var1 ve var3’ün çok az korelasyonu var veya hiç korelasyonu yok gibi görünüyor.

Örnek 2: Belirli Değişken Çiftlerinin Çizilmesi

Aşağıdaki kod, bir veri kümesindeki yalnızca ilk iki değişken için baz çifti grafiğinin nasıl oluşturulacağını gösterir:

 #create pairs plot for var1 and var2 only
even(df[, 1:2]) 

R'de belirli değişken çiftlerinin grafiğini çizme

Örnek 3: Çift grafiğinin estetiğini değiştirme

Aşağıdaki kod, başlık, renk ve etiketler de dahil olmak üzere çiftler grafiğinin estetiğinin nasıl değiştirileceğini gösterir:

 peers(df,
      col = ' blue ', #modify color
      labels = c(' First ', ' Second ', ' Third '), #modify labels
      main = ' Custom Title ') #modify title 

R'de özel çiftleri çizme

Örnek 4: ggpair’lerle korelasyonların elde edilmesi

Ayrıca GGally kütüphanesindeki ggpairs() fonksiyonunu kullanarak değişkenler arasındaki Pearson korelasyon katsayısını da alabilirsiniz. Aşağıdaki kod bu işlevin nasıl kullanılacağını gösterir:

 #install necessary libraries
install.packages('ggplot2')
install.packages('GGally')

#load libraries
library(ggplot2)
library(GGally)

#create pairs plot
ggpairs(df) 

R örneğinde ggpairs işlevi

Bu matrisi yorumlamanın yolu şu şekildedir:

  • Değişken adları matrisin dış kenarlarında görüntülenir.
  • Köşegenler boyunca yer alan kutular, her değişken için yoğunluk grafiğini gösterir.
  • Sol alt köşedeki kutular, her değişken arasındaki dağılım grafiğini gösterir.
  • Sağ üst köşedeki kutular, her değişken arasındaki Pearson korelasyon katsayısını gösterir. Örneğin var1 ile var2 arasındaki korelasyon 0,425’tir .

Temel R çiftleri() işlevine göre ggpairs() kullanmanın avantajı, değişkenler hakkında daha fazla bilgi alabilmenizdir. Spesifik olarak, değişkenlerin her ikili kombinasyonu arasındaki korelasyon katsayısını ve ayrıca her bir değişken için yoğunluk grafiğini görebilirsiniz.

ggpairs() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir