R'de gruba göre ilk n değeri nasıl seçilir
R’de en üstteki N değerlerini gruba göre seçmek için aşağıdaki yöntemlerden herhangi birini kullanabilirsiniz:
Yöntem 1: Grup başına ilk N değeri seçin (bağları göz ardı edin)
library (dplyr) #select top 5 values by group df %>% arrange(desc(values_column)) %>% group_by(group_column) %>% slice(1:5)
Yöntem 2: ilk N değerini gruba göre seçin (bağları dahil edin)
library (dplyr) #select top 5 values by group df %>% group_by(group_column) %>% top_n(5, values_column)
Aşağıdaki örnekler, R’de her yöntemin aşağıdaki veri çerçevesiyle nasıl kullanılacağını gösterir:
#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
points=c(19, 22, 15, NA, 14, 25, 25, 25),
rebounds=c(10, 6, 3, 7, 11, 13, 9, 12))
#view data frame
df
team points rebounds
1 A 19 10
2 to 22 6
3 to 15 3
4 A NA 7
5 B 14 11
6 B 25 13
7 B 25 9
8 B 25 12
Örnek 1: grup başına ilk N değeri seçin (bağları göz ardı edin)
Aşağıdaki kod, takıma göre gruplandırılmış, en yüksek puan değerlerine sahip ilk 2 satırın nasıl seçileceğini gösterir:
library (dplyr) #select top 2 rows with highest points values, grouped by team df %>% arrange(desc(points)) %>% group_by(team) %>% slice(1:2) # A tibble: 4 x 3 # Groups: team [2] team points rebounds 1 to 22 6 2 A 19 10 3 B 25 13 4 B 25 9
Sonuç, her takım için en yüksek puan değerlerine sahip iki satırı içerir.
B Takımı için aslında en yüksek puan değerine ( 25 ) eşit olan üç satır olduğunu, ancak çıktıda yalnızca iki satırın döndürüldüğünü unutmayın.
Bu yöntem yalnızca bağlantıları yok sayar.
Örnek 2: grup başına ilk N değeri seçin (bağları dahil edin)
Aşağıdaki kod, takıma göre gruplandırılmış, en yüksek puan değerlerine sahip ilk 2 satırın nasıl seçileceğini gösterir:
library (dplyr) #select top 2 rows with highest points values, grouped by team df %>% group_by(team) %>% top_n(2, dots) # A tibble: 5 x 3 # Groups: team [2] team points rebounds 1 A 19 10 2 to 22 6 3 B 25 13 4 B 25 9 5 B 25 12
Sonuç, her takım için en yüksek puan değerlerine sahip iki satırı içerir.
B Takımı için en yüksek puan değeri ( 25 ) için üç çizginin eşit olduğunu, dolayısıyla bu yöntemin nihai sonuca bu üç çizgiyi dahil ettiğini unutmayın.
Ek kaynaklar
Aşağıdaki eğitimlerde R’de diğer yaygın işlemlerin nasıl gerçekleştirileceği açıklanmaktadır:
R’deki herhangi bir sütunda değerin göründüğü satırlar nasıl seçilir
R’de belirli sütunlar nasıl seçilir
R’de dizine göre sütunlar nasıl seçilir