R'de dağılım grafiği matrisi nasıl oluşturulur (2 örnek)


Dağılım grafiği matrisi , bir veri kümesindeki farklı değişkenler arasındaki ikili ilişkiyi anlamanıza olanak tanıyan bir dağılım grafiği matrisidir.

R’de dağılım grafiği matrisi oluşturmanın iki yaygın yolu vardır:

Yöntem 1: Base R’yi kullanın

 #create scatterplot matrix (pch=20 means to use a solid circle for points)
plot(df, pch= 20 )

Yöntem 2: ggplot2 ve GGally paketlerini kullanın

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df)

Aşağıdaki örnekler, R’deki aşağıdaki veri çerçevesiyle her yöntemin pratikte nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (points=c(99, 90, 86, 88, 95, 99, 101, 104),
                 assists=c(33, 28, 31, 39, 40, 40, 35, 47),
                 rebounds=c(30, 28, 24, 24, 20, 20, 15, 12))

#view first few rows of data frame
head(df)

  points assists rebounds
1 99 33 30
2 90 28 28
3 86 31 24
4 88 39 24
5 95 40 20
6 99 40 20

Örnek 1: R Tabanını Kullanarak Dağılım Grafiği Matrisi Oluşturma

Veri çerçevemizdeki her değişken için bir dağılım grafiği matrisi oluşturmak amacıyla temel R grafiği() işlevini kullanabiliriz:

 #create scatterplot matrix
plot(df, pch= 20 , cex= 1.5 , col=' steelblue ')

R'deki dağılım grafiği matrisi

Matrisin yorumlanma şekli şu şekildedir:

  • Değişken adları çapraz kutular boyunca görüntülenir.
  • Diğer tüm kutular, değişkenlerin ikili kombinasyonlarının her biri arasındaki ilişkinin dağılım grafiğini görüntüler. Örneğin, matrisin sağ üst köşesindeki kutu, sayı ve ribaund değerlerinin dağılım grafiğini görüntüler. Sol orta alan, puanlar ve asistler vb. için değerlerin dağılım grafiğini gösterir.

Cex’in yoldaki noktaların boyutunu, col’un ise noktaların rengini kontrol ettiğini unutmayın.

Örnek 2: ggplot2 ve GGally Kullanarak Bir Dağılım Grafiği Matrisi Oluşturma

Veri çerçevemizdeki her değişken için bir dağılım grafiği matrisi oluşturmak amacıyla R’deki ggplot2 ve GGally paketlerindeki ggpairs() işlevini de kullanabiliriz:

 library (ggplot2)
library (GGally)

#create scatterplot matrix
ggpairs(df) 

ggplot2'deki dağılım grafiği matrisi

Bu dağılım grafiği matrisi, R baseplot() işleviyle aynı dağılım grafiklerini içerir, ancak buna ek olarak her bir değişken için bir yoğunluk grafiğinin yanı sıra değişkenlerin her ikili kombinasyonu arasındaki korelasyon katsayısını da görebiliriz.

Örneğin şunu görebiliriz:

  • Asistlerle sayılar arasındaki korelasyon katsayısı 0,571’dir .
  • Ribaundlarla sayılar arasındaki korelasyon katsayısı -0,598’dir .
  • Ribaund ve asist arasındaki korelasyon katsayısı -0,740’tır .

-0,740’ın yanındaki küçük yıldız ( * ) da ribauntlarla asistler arasındaki ilişkinin istatistiksel olarak anlamlı olduğunu gösteriyor.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak görevlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’de korelasyon matrisi nasıl oluşturulur
R’de gruba göre nokta bulutları nasıl oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir