R'de grup başına gözlemler nasıl sayılır?
Genellikle R’de grup başına gözlem sayısını saymak ilginizi çekebilir.
Neyse ki, dplyr kütüphanesinin count() fonksiyonunu kullanarak bunu yapmak kolaydır.
Bu eğitimde, aşağıdaki veri çerçevesini kullanarak bu işlevin pratik kullanımına ilişkin birkaç örnek açıklanmaktadır:
#create data frame df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'), position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '), points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31)) #view data frame df team position points 1 GA 4 2 AG 13 3AF 7 4 BG 8 5 BF 15 6 BF 15 7 BF 17 8 BG 9 9 GC 21 10 CF 22 11 CF 25 12 CF 31
Örnek 1: bir değişkene göre sayma
Aşağıdaki kod, takım başına toplam oyuncu sayısının nasıl sayılacağını gösterir:
library (dplyr)
#count total observations by variable 'team'
df %>% count(team)
# A tibble: 3 x 2
team n
1 to 3
2 B 5
3 C 4
Sonuçtan şunu görebiliriz:
- A takımı 3 oyuncudan oluşur
- B Takımı 5 oyuncudan oluşur
- C Takımı 4 oyuncudan oluşur
Bu single count() işlevi bize oyuncuların takım başına dağılımı hakkında güzel bir fikir veriyor.
İstersek sayıları da sıralayabileceğimizi unutmayın:
#count total observations by variable 'team' df %>% count(team, sort= TRUE ) # A tibble: 3 x 2 team n 1 B 5 2 C 4 3 to 3
Örnek 2: Birkaç değişkene göre sayma
Ayrıca birkaç değişkene göre de sıralama yapabiliriz:
#count total observations by 'team' and 'position'
df %>% count(team, position)
# A tibble: 6 x 3
team position n
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1
Sonuçtan şunu görebiliriz:
- A takımının “F” (forvet) pozisyonunda 1 oyuncusu ve “G” (guard) pozisyonunda 2 oyuncusu vardır.
- B takımının “F” (forvet) pozisyonunda 3, “G” (guard) pozisyonunda 2 oyuncusu vardır.
- C Takımının “F” (forvet) pozisyonunda 3, “G” (guard) pozisyonunda 1 oyuncusu bulunmaktadır.
Örnek 3: ağırlıklı sayı
Ayrıca bir değişkenin sayımlarını başka bir değişkene göre “ağırlıklandırabiliriz”. Örneğin, aşağıdaki kod, ağırlık olarak “puan” değişkenini kullanarak takım başına toplam gözlemlerin nasıl sayılacağını gösterir:
df %>% count(team, wt= points )
# A tibble: 3 x 2
team n
1 to 24
2 B 64
3 C 99
Count() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.