R'de kategorik veriler nasıl çizilir (örneklerle)


İstatistiklerde kategorik veriler , ad veya etiket alabilen verileri temsil eder.

Örnekler şunları içerir:

  • Sigara içme durumu (“sigara içen”, “sigara içmeyen”)
  • Göz rengi (“mavi”, “yeşil”, “ela”)
  • Eğitim düzeyi (örneğin “lise”, “lisans”, “yüksek lisans”)

Bu tür verileri görselleştirmek için yaygın olarak kullanılan üç grafik şunları içerir:

  • Grafik çubuğu
  • Mozaik araziler
  • Gruba göre kutu grafikleri

Aşağıdaki örnekler, bu grafiklerin her birinin R’de nasıl oluşturulacağını gösterir.

Örnek 1: Çubuk Grafikler

Aşağıdaki kod, belirli bir veri çerçevesindeki kaymaların sıklığını görselleştirmek için bir çubuk grafiğin nasıl oluşturulacağını gösterir:

 library (ggplot2)

#create data frame
df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'),
                 team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#create bar chart of teams
ggplot(df, aes (x=team)) +
  geom_bar()

X ekseni her takımın adını, y ekseni ise veri çerçevesindeki her takımın sıklığını gösterir.

Grafikteki çubukları en büyükten en küçüğe sıralamak için aşağıdaki kodu da kullanabiliriz:

 #create bar chart of teams, ordered from large to small
ggplot(df, aes (x= reorder (team, team, function (x)- length (x)))) +
  geom_bar(fill=' steelblue ') +
  labs(x=' Team ') 

Örnek 2: Gruba göre kutu grafikleri

Kümelenmiş kutu grafikleri, kategorik bir değişkene göre gruplandırılmış sayısal bir değişkeni görselleştirmenin yararlı bir yoludur.

Örneğin, aşağıdaki kod, takıma göre gruplandırılmış olarak atılan puanların dağılımını gösteren kutu grafiklerinin nasıl oluşturulacağını gösterir:

 library (ggplot2)

#create data frame
df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'),
                 team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#create boxplots of points, grouped by team
ggplot(df, aes (x=team, y=points)) +
  geom_boxplot(fill=' steelblue ')

X ekseni takımları, y ekseni ise her takımın kazandığı puanların dağılımını gösterir.

Örnek 3: mozaik çizimi

Döşenmiş grafik, iki farklı kategorik değişkenin frekanslarını tek bir grafikte görüntüleyen bir grafik türüdür.

Örneğin, aşağıdaki kod, tek bir grafikte “sonuç” ve “ekip” kategorik değişkenlerinin sıklığını gösteren bir mozaik grafiğin nasıl oluşturulacağını gösterir:

 #create data frame
df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'),
                 team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'),
                 points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19),
                 rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8))

#create table of counts
counts <- table(df$result, df$team)

#create mosaic plot
mosaicplot(counts, xlab=' Game Result ', ylab=' Team ',
           main=' Wins by Team ', col=' steelblue ') 

R'deki mozaik arazi

X ekseni oyun sonucunu, y ekseni ise dört farklı takımı gösterir.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer ortak grafiklerin nasıl oluşturulacağı açıklanmaktadır:

R’de yığılmış bir bar grafiği nasıl oluşturulur
R’de kümelenmiş bir bar grafiği nasıl oluşturulur
R’de Yığılmış Nokta Grafiği Nasıl Oluşturulur

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir