R'de kategorik veriler nasıl çizilir (örneklerle)
İstatistiklerde kategorik veriler , ad veya etiket alabilen verileri temsil eder.
Örnekler şunları içerir:
- Sigara içme durumu (“sigara içen”, “sigara içmeyen”)
- Göz rengi (“mavi”, “yeşil”, “ela”)
- Eğitim düzeyi (örneğin “lise”, “lisans”, “yüksek lisans”)
Bu tür verileri görselleştirmek için yaygın olarak kullanılan üç grafik şunları içerir:
- Grafik çubuğu
- Mozaik araziler
- Gruba göre kutu grafikleri
Aşağıdaki örnekler, bu grafiklerin her birinin R’de nasıl oluşturulacağını gösterir.
Örnek 1: Çubuk Grafikler
Aşağıdaki kod, belirli bir veri çerçevesindeki kaymaların sıklığını görselleştirmek için bir çubuk grafiğin nasıl oluşturulacağını gösterir:
library (ggplot2) #create data frame df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'), team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'), points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19), rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8)) #create bar chart of teams ggplot(df, aes (x=team)) + geom_bar()
X ekseni her takımın adını, y ekseni ise veri çerçevesindeki her takımın sıklığını gösterir.
Grafikteki çubukları en büyükten en küçüğe sıralamak için aşağıdaki kodu da kullanabiliriz:
#create bar chart of teams, ordered from large to small ggplot(df, aes (x= reorder (team, team, function (x)- length (x)))) + geom_bar(fill=' steelblue ') + labs(x=' Team ')
Örnek 2: Gruba göre kutu grafikleri
Kümelenmiş kutu grafikleri, kategorik bir değişkene göre gruplandırılmış sayısal bir değişkeni görselleştirmenin yararlı bir yoludur.
Örneğin, aşağıdaki kod, takıma göre gruplandırılmış olarak atılan puanların dağılımını gösteren kutu grafiklerinin nasıl oluşturulacağını gösterir:
library (ggplot2) #create data frame df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'), team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'), points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19), rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8)) #create boxplots of points, grouped by team ggplot(df, aes (x=team, y=points)) + geom_boxplot(fill=' steelblue ')
X ekseni takımları, y ekseni ise her takımın kazandığı puanların dağılımını gösterir.
Örnek 3: mozaik çizimi
Döşenmiş grafik, iki farklı kategorik değişkenin frekanslarını tek bir grafikte görüntüleyen bir grafik türüdür.
Örneğin, aşağıdaki kod, tek bir grafikte “sonuç” ve “ekip” kategorik değişkenlerinin sıklığını gösteren bir mozaik grafiğin nasıl oluşturulacağını gösterir:
#create data frame df <- data. frame (result = c('W', 'L', 'W', 'W', 'W', 'L', 'W', 'L', 'W', 'L'), team = c('B', 'B', 'B', 'B', 'D', 'A', 'A', 'A', 'C', 'C'), points = c(12, 28, 19, 22, 32, 45, 22, 28, 13, 19), rebounds = c(5, 7, 7, 12, 11, 4, 10, 7, 8, 8)) #create table of counts counts <- table(df$result, df$team) #create mosaic plot mosaicplot(counts, xlab=' Game Result ', ylab=' Team ', main=' Wins by Team ', col=' steelblue ')
X ekseni oyun sonucunu, y ekseni ise dört farklı takımı gösterir.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer ortak grafiklerin nasıl oluşturulacağı açıklanmaktadır:
R’de yığılmış bir bar grafiği nasıl oluşturulur
R’de kümelenmiş bir bar grafiği nasıl oluşturulur
R’de Yığılmış Nokta Grafiği Nasıl Oluşturulur