R'de gather fonksiyonu nasıl kullanılır (örneklerle)
Tidyr paketindeki toplama() işlevi, birden çok sütundaki bir anahtar/değer çiftini “toplamak” için kullanılabilir.
Bu işlev aşağıdaki temel sözdizimini kullanır:
toplama (veri, anahtar değer vb.)
Altın:
- data : Veri çerçevesinin adı
- key : Oluşturulacak anahtar sütunun adı
- değer : Oluşturulacak değer sütununun adı
- … : Toplanacak sütunları belirtin
Aşağıdaki örnekler bu fonksiyonun pratikte nasıl kullanılacağını göstermektedir.
Örnek 1: İki sütunun değerlerini toplayın
R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12)) #view data frame df player year1 year2 1 to 12 22 2 B 15 29 3 C 19 18 4 D 19 12
“Yıl” ve “puan” olarak adlandırılan iki yeni sütunu aşağıdaki gibi oluşturmak için Collect() fonksiyonunu kullanabiliriz:
library (tidyr) #gather data from columns 2 and 3 gather(df, key=" year ", value=" points ", 2:3) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12
Örnek 2: İkiden fazla sütundan değer toplayın
R’de aşağıdaki veri çerçevesine sahip olduğumuzu varsayalım:
#create data frame df2 <- data. frame (player=c('A', 'B', 'C', 'D'), year1=c(12, 15, 19, 19), year2=c(22, 29, 18, 12), year3=c(17, 17, 22, 25)) #view data frame df2 player year1 year2 year3 1 A 12 22 17 2 B 15 29 17 3 C 19 18 22 4 D 19 12 25
2, 3 ve 4 numaralı sütunlardaki değerleri “yıl” ve “puan” adı verilen iki yeni sütunda “toplamak” için Collect() işlevini aşağıdaki gibi kullanabiliriz:
library (tidyr) #gather data from columns 2, 3, and 4 gather(df, key=" year ", value=" points ", 2:4) player year points 1 A year1 12 2 B year1 15 3 C year1 19 4 D year1 19 5 A year2 22 6 B year2 29 7 C year2 18 8 D year2 12 9 A year3 17 10 B year3 17 11 C year3 22 12 D year3 25
Ek kaynaklar
Tidyr paketinin amacı aşağıdaki özelliklere sahip “düzenli” veriler oluşturmaktır:
- Her sütun bir değişkendir.
- Her satır bir gözlemdir.
- Her hücre benzersiz bir değerdir.
Tidyr paketi sıralı veriler oluşturmak için dört ana işlevi kullanır:
1. spread() işlevi.
2. Collect() işlevi.
3. Different() işlevi.
4. Birim() işlevi.
Bu dört işlevde ustalaşırsanız, herhangi bir veri çerçevesinden “düzenli” veriler oluşturabileceksiniz.