R'de çubuk grafik nasıl oluşturulur


Şerit grafiği, tek bir bant boyunca sayısal verileri görüntüleyen bir grafik türüdür. Kutu grafiklerine benzer şekilde çubuk grafikler de veri dağılımını görselleştirmenize yardımcı olabilir. Çubuk grafikler, örnek boyutları küçük olduğunda kutu grafiklerine iyi bir alternatif olabilir, böylece tek tek veri noktalarını görebilirsiniz.

Bu eğitimde, yerleşik stripchart() işlevini kullanarak R’de şerit grafiğinin nasıl oluşturulacağı açıklanmaktadır.

Stripchart() işlevi

R’de çubuk grafik oluşturmak için temel sözdizimi şöyledir:

stripchart(x, method, jitter, main, xlab, ylab, col, pch, Vertical, group.names)

  • x : çizilecek sayısal bir vektör veya sayısal vektörlerin listesi. Bir olay örgüsü oluşturmak için gereken tek argüman budur.
  • yöntem : Aynı değerlere sahip noktaları ayırmak için kullanılacak yöntem. Varsayılan “overplot” yöntemi bu noktaların üzerine çizilmesine neden olur, ancak noktaları titretmek için “jitter” veya noktaları istiflemek için “yığın” belirlemek mümkündür.
  • jitter : Method = “jitter” kullanıldığında, bu, uygulanacak titreşim miktarını sağlar.
  • ana: grafik başlığı
  • xlab : x ekseni etiketi
  • ileb : y ekseni etiketi
  • col : çizim noktalarının rengi
  • pch : çizim noktalarının şekli
  • dikey : dikey “DOĞRU” olduğunda, yol varsayılan olarak yatay yerine dikey olarak çizilir
  • group.names : birden fazla sayısal vektör çizilirse grafiğin yanında yazdırılacak grup etiketleri.

Tek bir dijital vektör için çubuk grafik

Aşağıdaki örnek, tek bir sayısal vektör için bir çubuk grafik oluşturmak amacıyla gömülü R veri kümesi irisini kullanır.

 #view first six rows of iris dataset
head(iris)

# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#1 5.1 3.5 1.4 0.2 setosa
#2 4.9 3.0 1.4 0.2 setosa
#3 4.7 3.2 1.3 0.2 setosa
#4 4.6 3.1 1.5 0.2 setosa
#5 5.0 3.6 1.4 0.2 setosa
#6 5.4 3.9 1.7 0.4 setosa

Aşağıdaki kod, Sepal.Length değişkeni için bir temel bant grafiği oluşturur:

 stripchart(iris$Sepal.Length)

Ayrıca x eksenine bir başlık ve etiket eklemek, noktaların rengini değiştirmek, noktaların şeklini değiştirmek için ek argümanlar ekleyebilir ve tek tek noktaların çakışmaması için “jitter” yöntemini kullanabiliriz:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
           method = 'jitter')

Noktaları karıştırmak yerine onları “istifleyebiliriz”:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
           xlab = 'Sepal Length',
           col = 'red',
           pch = 1,
method = 'stack' )

Grafiği varsayılan yatay yerine dikey olarak da görüntüleyebilir ve eksen etiketini y ekseninde olacak şekilde değiştirebiliriz:

 stripchart(iris$Sepal.Length,
           main = 'Sepal Length Distribution',
ylab = 'Sepal Length' ,
           col = 'red',
           pch = 1,
           method = 'jitter',
vertical = TRUE )

Birden çok sayısal vektör için çubuk grafik

Ayrıca sayısal vektörlerin bir listesini ileterek tek bir grafikte birden fazla şerit grafik çizebiliriz.

Aşağıdaki kod, iris veri kümesindeki Sepal Uzunluk ve Genişlik değişkenlerini içeren bir liste oluşturur ve tek bir grafikte her değişken için bir çubuk grafik üretir:

 #create list of variables
x <- list('Sepal Length' = iris$Sepal.Length, 'Sepal Width' = iris$Sepal.Width)

#create plot that contains one strip chart per variable
stripchart(x,
           main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter')

Önceki örnekte olduğu gibi, çubuk grafikleri varsayılan yatay yerine dikey olarak çizmeyi seçebiliriz:

 stripchart(x, main = 'Sepal Width & Length Distributions',
           xlab = 'Measurement', 
           ylab = 'Variable',
           col = c('steelblue', 'coral2'),
           pch = 16,
           method = 'jitter',
vertical = TRUE )

Ek olarak, y~x biçiminde bir formülü stripchart() işlevine aktarabiliriz; burada y , x değerine göre gruplandırılmış sayısal bir vektördür.

Örneğin, iris veri setinde, verileri üç farklı değere sahip olan türlere göre gruplandırabiliriz (“setosa”, “versicolor” ve “virginica”) ve ardından her türün sepal uzunluğunu bir çubuk grafikte çizebiliriz:

 stripchart(Sepal.Length ~ Species,
           data = iris,
           main = 'Sepal Length by Species',
           xlab = 'Species', 
           ylab = 'Sepal Length',
           col = c('steelblue', 'coral2', 'purple'),
           pch = 16,
           method = 'jitter',
           vertical = TRUE)

R’deki stripchart() işlevinin tüm belgelerini görüntülemek için şunu yazmanız yeterlidir:

 ?stripchart

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir