R'de gruba göre ilk n değeri nasıl seçilir


R’de en üstteki N değerlerini gruba göre seçmek için aşağıdaki yöntemlerden herhangi birini kullanabilirsiniz:

Yöntem 1: Grup başına ilk N değeri seçin (bağları göz ardı edin)

 library (dplyr)

#select top 5 values by group
df %>% 
  arrange(desc(values_column)) %>% 
  group_by(group_column) %>%
  slice(1:5)

Yöntem 2: ilk N değerini gruba göre seçin (bağları dahil edin)

 library (dplyr)

#select top 5 values by group
df %>%
  group_by(group_column) %>%
  top_n(5, values_column)

Aşağıdaki örnekler, R’de her yöntemin aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(19, 22, 15, NA, 14, 25, 25, 25),
                 rebounds=c(10, 6, 3, 7, 11, 13, 9, 12))

#view data frame
df

  team points rebounds
1 A 19 10
2 to 22 6
3 to 15 3
4 A NA 7
5 B 14 11
6 B 25 13
7 B 25 9
8 B 25 12

Örnek 1: grup başına ilk N değeri seçin (bağları göz ardı edin)

Aşağıdaki kod, takıma göre gruplandırılmış, en yüksek puan değerlerine sahip ilk 2 satırın nasıl seçileceğini gösterir:

 library (dplyr)

#select top 2 rows with highest points values, grouped by team 
df %>% 
  arrange(desc(points)) %>% 
  group_by(team) %>%
  slice(1:2)

# A tibble: 4 x 3
# Groups: team [2]
  team points rebounds
        
1 to 22 6
2 A 19 10
3 B 25 13
4 B 25 9

Sonuç, her takım için en yüksek puan değerlerine sahip iki satırı içerir.

B Takımı için aslında en yüksek puan değerine ( 25 ) eşit olan üç satır olduğunu, ancak çıktıda yalnızca iki satırın döndürüldüğünü unutmayın.

Bu yöntem yalnızca bağlantıları yok sayar.

Örnek 2: grup başına ilk N değeri seçin (bağları dahil edin)

Aşağıdaki kod, takıma göre gruplandırılmış, en yüksek puan değerlerine sahip ilk 2 satırın nasıl seçileceğini gösterir:

 library (dplyr)

#select top 2 rows with highest points values, grouped by team 
df %>%
  group_by(team) %>%
  top_n(2, dots)

# A tibble: 5 x 3
# Groups: team [2]
  team points rebounds
        
1 A 19 10
2 to 22 6
3 B 25 13
4 B 25 9
5 B 25 12

Sonuç, her takım için en yüksek puan değerlerine sahip iki satırı içerir.

B Takımı için en yüksek puan değeri ( 25 ) için üç çizginin eşit olduğunu, dolayısıyla bu yöntemin nihai sonuca bu üç çizgiyi dahil ettiğini unutmayın.

Ek kaynaklar

Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:

R’deki herhangi bir sütunda değerin göründüğü satırlar nasıl seçilir
R’de belirli sütunlar nasıl seçilir
R’de dizine göre sütunlar nasıl seçilir

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir