R에서 파이프 연산자를 사용하는 방법(예제 포함)


R에서 파이프 연산자( %>% )를 사용하여 일련의 작업을 함께 “파이프”할 수 있습니다.

이 연산자는 데이터 프레임에서 일련의 작업을 수행하기 위해 R의 dplyr 패키지와 함께 가장 일반적으로 사용됩니다.

파이프 연산자의 기본 구문은 다음과 같습니다.

 df %>% 
  do_this_operation %>% 
  then_do_this_operation %>%
  then_do_this_operation ...

파이프 연산자는 단순히 한 작업의 결과를 그 아래의 다음 작업으로 전달합니다.

파이프 연산자를 사용하면 코드를 매우 쉽게 읽을 수 있다는 장점이 있습니다.

다음 예에서는 R에 내장된 mtcars 데이터 세트를 사용하여 다양한 시나리오에서 파이프 연산자를 사용하는 방법을 보여줍니다.

 #view first six rows of mtcars dataset
head(mtcars)

                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

예 1: 파이프 연산자를 사용하여 변수 요약

다음 코드는 파이프 연산자( %>% )를 사용하여 cyl 변수별로 그룹화한 다음 mpg 변수의 평균 값을 요약하는 방법을 보여줍니다.

 library (dplyr)

#summarize mean mpg grouped by cyl
mtcars %>% 
  group_by(cyl) %>% 
  summarize(mean_mpg = mean(mpg))

# A tibble: 3 x 2
    cyl mean_mpg
      
1 4 26.7
2 6 19.7
3 8 15.1

결과에서 우리는 다음을 볼 수 있습니다:

  • 실린더 값이 4인 자동차의 평균 mpg 값은 26.7 입니다.
  • 실린더 값이 6인 자동차의 평균 mpg 값은 19.7 입니다.
  • 실린더 값이 8인 자동차의 평균 mpg 값은 15.1 입니다.

파이프 연산자가 코드 해석을 어떻게 더 쉽게 만드는지 확인하세요.

기본적으로 그는 이렇게 말합니다.

  • mtcars 데이터 프레임을 가져옵니다.
  • cyl 변수로 그룹화하십시오.
  • 그런 다음 mpg 변수의 평균값을 요약합니다.

예 2: 파이프 연산자를 사용하여 여러 변수를 그룹화하고 요약합니다.

다음 코드는 파이프 연산자( %>% )를 사용하여 cylam 변수를 기준으로 그룹화한 다음 mpg 변수의 평균과 hp 변수의 표준 편차를 요약하는 방법을 보여줍니다.

 library (dplyr)

#summarize mean mpg and standard dev of hp grouped by cyl and am
mtcars %>% 
  group_by(cyl, am) %>% 
  summarize(mean_mpg = mean(mpg),
            sd_hp = sd(hp))

# A tibble: 6 x 4
# Groups: cyl[3]
    cyl am mean_mpg sd_hp
        
1 4 0 22.9 19.7 
2 4 1 28.1 22.7 
3 6 0 19.1 9.18
4 6 1 20.6 37.5 
5 8 0 15.0 33.4 
6 8 1 15.4 50.2 

결과에서 우리는 다음을 볼 수 있습니다:

  • cyl 값이 4이고 am 값이 0인 자동차의 경우 평균 mpg 값은 22.9 이고 hp 값의 표준 편차는 19.7 입니다.
  • cyl 값이 4이고 am 값이 1인 자동차의 경우 평균 mpg 값은 28.1 이고 hp 값의 표준 편차는 22.7 입니다.

등등.

다시 한 번, 파이프 연산자가 코드 해석을 어떻게 더 쉽게 만드는지 확인하세요.

기본적으로 그는 이렇게 말합니다.

  • mtcars 데이터 프레임을 가져옵니다.
  • cylam 변수로 그룹화합니다.
  • 그런 다음 mpg 변수의 평균값과 hp 변수의 표준편차를 요약합니다.

예 3: 파이프 연산자를 사용하여 새 변수 생성

다음 코드는 dplyr 패키지의 mutate 함수와 함께 파이프 연산자( %>% )를 사용하여 mtcars 데이터 프레임에 두 개의 새 변수를 생성하는 방법을 보여줍니다.

 library (dplyr)

#add two new variables in mtcars
new_mtcars <- mtcars %>%
                mutate(mpg2 = mpg*2,
                       mpg_root = sqrt(mpg))

#view first six rows of new data frame
head(new_mtcars)

   mpg cyl disp hp drat wt qsec vs am gear carb mpg2 mpg_root
1 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 42.0 4.582576
2 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 42.0 4.582576
3 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 45.6 4.774935
4 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 42.8 4.626013
5 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 37.4 4.324350
6 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 36.2 4.254409

결과에서 우리는 다음을 볼 수 있습니다:

  • 새로운 mpg2 열에는 mpg 열의 값에 2를 곱한 값이 포함됩니다.
  • 새로운 mpg_root 열에는 mpg 열 값의 제곱근이 포함됩니다.

다시 한 번, 파이프 연산자가 코드 해석을 어떻게 더 쉽게 만드는지 확인하세요.

기본적으로 그는 이렇게 말합니다.

  • mtcars 데이터 프레임을 가져옵니다.
  • mpg2 라는 새 열과 mpg_root 라는 새 열을 만듭니다.

관련 항목: dplyr에서 transmute() 함수를 사용하는 방법

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.

R에서 물결표 연산자(~)를 사용하는 방법
R에서 달러 기호 연산자($)를 사용하는 방법
R에서 “NOT IN” 연산자를 사용하는 방법
R에서 %in% 연산자를 사용하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다