R'de data.table'ın dcast işlevi nasıl kullanılır?
Bir veri çerçevesini uzun formattan geniş formata yeniden şekillendirmek için R’deki data.table paketinin dcast fonksiyonunu kullanabilirsiniz.
Bu işlev özellikle belirli değişkenleri bir veri çerçevesinde diğer değişkenlere göre gruplandırılmış şekilde özetlemek istediğinizde kullanışlıdır.
Aşağıdaki örnekler, R’de aşağıdaki veri çerçevesiyle dcast işlevinin pratikte nasıl kullanılacağını gösterir:
library (data.table) #create data frame df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'), position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'), points=c(18, 13, 10, 12, 16, 25, 24, 31), assists=c(9, 8, 8, 5, 12, 15, 10, 7)) #convert data frame to data table dt <- setDT(df) #view data table dt team position points assists 1: AG 18 9 2: AG 13 8 3:AF 10 8 4:AF 12 5 5: BG 16 12 6: BG 25 15 7: BF 24 10 8: BF 31 7
Örnek 1: Diğer değişkenlere göre gruplandırılmış bir değişkene ilişkin metriği hesaplama
Aşağıdaki kod, takım ve konum değişkenlerine göre gruplandırılmış ortalama puan değerini hesaplamak için dcast işlevinin nasıl kullanılacağını gösterir:
library (data.table) #calculate mean points value by team and position dt_new <- dcast(dt, team + position ~., fun. aggregate = mean, value. var = ' points ') #view results dt_new team position. 1:AF 11.0 2: AG 15.5 3: BF 27.5 4: BG 20.5
Örnek 2: Bir değişken için diğer değişkenlere göre gruplandırılmış birden çok metriği hesaplama
Aşağıdaki kod, takım ve konum değişkenlerine göre gruplandırılmış ortalama puan değerini ve maksimum puan değerini hesaplamak için dcast işlevinin nasıl kullanılacağını gösterir:
library (data.table) #calculate mean and max points values by team and position dt_new <- dcast(dt, team + position ~., fun. aggregate = list(mean, max), value. var = ' points ') #view results dt_new team position points_mean points_max 1:AF 11.0 12 2: AG 15.5 18 3: BF 27.5 31 4: BG 20.5 25
Örnek 3: Diğer değişkenlere göre gruplandırılmış birden fazla değişken için metriği hesaplama
Aşağıdaki kod, takım ve konum değişkenlerine göre gruplandırılmış ortalama puan değerini ve ortalama destek değerini hesaplamak için dcast işlevinin nasıl kullanılacağını gösterir:
library (data.table) #calculate mean and max points values by team and position dt_new <- dcast(dt, team + position ~., fun. aggregate = mean, value. var = c(' points ', ' assists ')) #view results dt_new team position points assists 1:AF 11.0 6.5 2: AG 15.5 8.5 3: BF 27.5 8.5 4: BG 20.5 13.5
Ek kaynaklar
Aşağıdaki eğitimler veri tabloları hakkında ek bilgi sağlar:
R’deki data.table ve veri çerçevesi: üç temel fark
R’de bir data.table nasıl filtrelenir
Birden çok veri tablosu oluşturmak için R’de rbindlist nasıl kullanılır?