R'de data.table'ın dcast işlevi nasıl kullanılır?


Bir veri çerçevesini uzun formattan geniş formata yeniden şekillendirmek için R’deki data.table paketinin dcast fonksiyonunu kullanabilirsiniz.

Bu işlev özellikle belirli değişkenleri bir veri çerçevesinde diğer değişkenlere göre gruplandırılmış şekilde özetlemek istediğinizde kullanışlıdır.

Aşağıdaki örnekler, R’de aşağıdaki veri çerçevesiyle dcast işlevinin pratikte nasıl kullanılacağını gösterir:

 library (data.table)

#create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 position=c('G', 'G', 'F', 'F', 'G', 'G', 'F', 'F'),
                 points=c(18, 13, 10, 12, 16, 25, 24, 31),
                 assists=c(9, 8, 8, 5, 12, 15, 10, 7))

#convert data frame to data table
dt <- setDT(df)

#view data table
dt

   team position points assists
1: AG 18 9
2: AG 13 8
3:AF 10 8
4:AF 12 5
5: BG 16 12
6: BG 25 15
7: BF 24 10
8: BF 31 7

Örnek 1: Diğer değişkenlere göre gruplandırılmış bir değişkene ilişkin metriği hesaplama

Aşağıdaki kod, takım ve konum değişkenlerine göre gruplandırılmış ortalama puan değerini hesaplamak için dcast işlevinin nasıl kullanılacağını gösterir:

 library (data.table)

#calculate mean points value by team and position
dt_new <- dcast(dt,
                team + position ~.,
                fun. aggregate = mean, 
                value. var = ' points ')

#view results
dt_new

   team position.
1:AF 11.0
2: AG 15.5
3: BF 27.5
4: BG 20.5

Örnek 2: Bir değişken için diğer değişkenlere göre gruplandırılmış birden çok metriği hesaplama

Aşağıdaki kod, takım ve konum değişkenlerine göre gruplandırılmış ortalama puan değerini ve maksimum puan değerini hesaplamak için dcast işlevinin nasıl kullanılacağını gösterir:

 library (data.table)

#calculate mean and max points values by team and position
dt_new <- dcast(dt,
                team + position ~.,
                fun. aggregate = list(mean, max), 
                value. var = ' points ')

#view results
dt_new

   team position points_mean points_max
1:AF 11.0 12
2: AG 15.5 18
3: BF 27.5 31
4: BG 20.5 25

Örnek 3: Diğer değişkenlere göre gruplandırılmış birden fazla değişken için metriği hesaplama

Aşağıdaki kod, takım ve konum değişkenlerine göre gruplandırılmış ortalama puan değerini ve ortalama destek değerini hesaplamak için dcast işlevinin nasıl kullanılacağını gösterir:

 library (data.table)

#calculate mean and max points values by team and position
dt_new <- dcast(dt,
                team + position ~.,
                fun. aggregate = mean, 
                value. var = c(' points ', ' assists '))

#view results
dt_new

   team position points assists
1:AF 11.0 6.5
2: AG 15.5 8.5
3: BF 27.5 8.5
4: BG 20.5 13.5

Ek kaynaklar

Aşağıdaki eğitimler veri tabloları hakkında ek bilgi sağlar:

R’deki data.table ve veri çerçevesi: üç temel fark
R’de bir data.table nasıl filtrelenir
Birden çok veri tablosu oluşturmak için R’de rbindlist nasıl kullanılır?

Yorum ekle

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir