R'de boru operatörü nasıl kullanılır (örneklerle)
Bir dizi işlemi birlikte “bağlamak” için R’deki yönlendirme operatörünü ( %>% ) kullanabilirsiniz.
Bu operatör en yaygın olarak R’deki dplyr paketiyle birlikte bir veri çerçevesi üzerinde bir dizi işlem gerçekleştirmek için kullanılır.
Boru operatörünün temel sözdizimi şöyledir:
df %>%
do_this_operation %>%
then_do_this_operation %>%
then_do_this_operation ...
Boru operatörü bir işlemin sonuçlarını bir altındaki sonraki işleme aktarır.
Boru operatörünü kullanmanın avantajı kodun okunmasını son derece kolay hale getirmesidir.
Aşağıdaki örnekler, R’de yerleşik mtcars veri kümesiyle boru operatörünün farklı senaryolarda nasıl kullanılacağını gösterir.
#view first six rows of mtcars dataset
head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1
Örnek 1: Bir Değişkeni Özetlemek için Boru Operatörünü Kullanma
Aşağıdaki kod, silindir değişkenine göre gruplamak ve ardından mpg değişkeninin ortalama değerini özetlemek için boru operatörünün ( %>% ) nasıl kullanılacağını gösterir:
library (dplyr)
#summarize mean mpg grouped by cyl
mtcars %>%
group_by(cyl) %>%
summarize(mean_mpg = mean(mpg))
# A tibble: 3 x 2
cyl mean_mpg
1 4 26.7
2 6 19.7
3 8 15.1
Sonuçtan şunu görebiliriz:
- Silindir değeri 4 olan araçlarda ortalama mpg değeri 26,7’dir .
- Silindir değeri 6 olan araçlarda ortalama mpg değeri 19,7’dir .
- Silindir değeri 8 olan araçlarda ortalama mpg değeri 15,1’dir .
Boru operatörünün kodun yorumlanmasını nasıl kolaylaştırdığına dikkat edin.
Temel olarak şöyle diyor:
- Mtcars veri çerçevesini alın.
- Silindir değişkenine göre gruplandırın.
- Daha sonra mpg değişkeninin ortalama değerini özetleyin.
Örnek 2: Birden Çok Değişkeni Gruplandırmak ve Özetlemek için Boru Operatörünü Kullanma
Aşağıdaki kod, cyl ve am değişkenlerine göre gruplamak ve ardından mpg değişkeninin ortalamasını ve hp değişkeninin standart sapmasını özetlemek için boru operatörünün ( %>% ) nasıl kullanılacağını gösterir:
library (dplyr)
#summarize mean mpg and standard dev of hp grouped by cyl and am
mtcars %>%
group_by(cyl, am) %>%
summarize(mean_mpg = mean(mpg),
sd_hp = sd(hp))
# A tibble: 6 x 4
# Groups: cyl[3]
cyl am mean_mpg sd_hp
1 4 0 22.9 19.7
2 4 1 28.1 22.7
3 6 0 19.1 9.18
4 6 1 20.6 37.5
5 8 0 15.0 33.4
6 8 1 15.4 50.2
Sonuçtan şunu görebiliriz:
- Silindir değeri 4, am değeri 0 olan araçlarda ortalama mpg değeri 22,9 , hp değerinin standart sapması ise 19,7’dir .
- Silindir değeri 4, am değeri 1 olan araçlarda ortalama mpg değeri 28,1 , hp değerinin standart sapması ise 22,7’dir .
Ve benzeri.
Yine boru operatörünün kodun yorumlanmasını nasıl kolaylaştırdığına dikkat edin.
Temel olarak şöyle diyor:
- Mtcars veri çerçevesini alın.
- cyl ve am değişkenlerine göre gruplayın.
- Daha sonra mpg değişkeninin ortalama değerini ve hp değişkeninin standart sapmasını özetleyin.
Örnek 3: Yeni Değişkenler Oluşturmak için Boru Operatörünü Kullanma
Aşağıdaki kod, mtcars veri çerçevesinde iki yeni değişken oluşturmak için dplyr paketindeki mutate işleviyle birlikte yöneltme operatörünün ( %>% ) nasıl kullanılacağını gösterir:
library (dplyr)
#add two new variables in mtcars
new_mtcars <- mtcars %>%
mutate(mpg2 = mpg*2,
mpg_root = sqrt(mpg))
#view first six rows of new data frame
head(new_mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb mpg2 mpg_root
1 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 42.0 4.582576
2 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 42.0 4.582576
3 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 45.6 4.774935
4 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 42.8 4.626013
5 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 37.4 4.324350
6 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 36.2 4.254409
Sonuçtan şunu görebiliriz:
- Yeni mpg2 sütunu, mpg sütunundaki değerlerin 2 ile çarpılmasını içerir.
- Yeni mpg_root sütunu, mpg sütunundaki değerlerin karekökünü içerir.
Yine boru operatörünün kodun yorumlanmasını nasıl kolaylaştırdığına dikkat edin.
Temel olarak şöyle diyor:
- Mtcars veri çerçevesini alın.
- mpg2 adında yeni bir sütun ve mpg_root adında yeni bir sütun oluşturun.
İlgili: dplyr’de transmute() işlevi nasıl kullanılır?
Ek kaynaklar
Aşağıdaki eğitimlerde R’deki diğer yaygın işlevlerin nasıl kullanılacağı açıklanmaktadır:
R’de Tilde operatörü (~) nasıl kullanılır?
R’de dolar işareti operatörü ($) nasıl kullanılır?
R’de “NOT IN” operatörü nasıl kullanılır?
R’de %in% operatörü nasıl kullanılır?