R'de grup başına gözlemler nasıl sayılır?


Genellikle R’de grup başına gözlem sayısını saymak ilginizi çekebilir.

Neyse ki, dplyr kütüphanesinin count() fonksiyonunu kullanarak bunu yapmak kolaydır.

Bu eğitimde, aşağıdaki veri çerçevesini kullanarak bu işlevin pratik kullanımına ilişkin birkaç örnek açıklanmaktadır:

 #create data frame
df <- data.frame(team = c('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'CC'),
                 position = c('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 points = c(4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#view data frame
df

   team position points
1 GA 4
2 AG 13
3AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 GC 21
10 CF 22
11 CF 25
12 CF 31

Örnek 1: bir değişkene göre sayma

Aşağıdaki kod, takım başına toplam oyuncu sayısının nasıl sayılacağını gösterir:

 library (dplyr)

#count total observations by variable 'team'
df %>% count(team)

# A tibble: 3 x 2
  team n
   
1 to 3
2 B 5
3 C 4

Sonuçtan şunu görebiliriz:

  • A takımı 3 oyuncudan oluşur
  • B Takımı 5 oyuncudan oluşur
  • C Takımı 4 oyuncudan oluşur

Bu single count() işlevi bize oyuncuların takım başına dağılımı hakkında güzel bir fikir veriyor.

İstersek sayıları da sıralayabileceğimizi unutmayın:

 #count total observations by variable 'team'
df %>% count(team, sort= TRUE )

# A tibble: 3 x 2
  team n
   
1 B 5
2 C 4
3 to 3

Örnek 2: Birkaç değişkene göre sayma

Ayrıca birkaç değişkene göre de sıralama yapabiliriz:

 #count total observations by 'team' and 'position'
df %>% count(team, position)

# A tibble: 6 x 3
  team position n
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 GC 1

Sonuçtan şunu görebiliriz:

  • A takımının “F” (forvet) pozisyonunda 1 oyuncusu ve “G” (guard) pozisyonunda 2 oyuncusu vardır.
  • B takımının “F” (forvet) pozisyonunda 3, “G” (guard) pozisyonunda 2 oyuncusu vardır.
  • C Takımının “F” (forvet) pozisyonunda 3, “G” (guard) pozisyonunda 1 oyuncusu bulunmaktadır.

Örnek 3: ağırlıklı sayı

Ayrıca bir değişkenin sayımlarını başka bir değişkene göre “ağırlıklandırabiliriz”. Örneğin, aşağıdaki kod, ağırlık olarak “puan” değişkenini kullanarak takım başına toplam gözlemlerin nasıl sayılacağını gösterir:

 df %>% count(team, wt= points )

# A tibble: 3 x 2
  team n
   
1 to 24
2 B 64
3 C 99

Count() işlevine ilişkin tüm belgeleri burada bulabilirsiniz.

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir