R에서 파이프 연산자를 사용하는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 17, 2023 가이드 댓글 0개

R에서 파이프 연산자( %>% )를 사용하여 일련의 작업을 함께 “파이프”할 수 있습니다.

이 연산자는 데이터 프레임에서 일련의 작업을 수행하기 위해 R의 dplyr 패키지와 함께 가장 일반적으로 사용됩니다.

파이프 연산자의 기본 구문은 다음과 같습니다.

 df %>% 
  do_this_operation %>% 
  then_do_this_operation %>%
  then_do_this_operation ...

파이프 연산자는 단순히 한 작업의 결과를 그 아래의 다음 작업으로 전달합니다.

파이프 연산자를 사용하면 코드를 매우 쉽게 읽을 수 있다는 장점이 있습니다.

다음 예에서는 R에 내장된 mtcars 데이터 세트를 사용하여 다양한 시나리오에서 파이프 연산자를 사용하는 방법을 보여줍니다.

 #view first six rows of mtcars dataset
head(mtcars)

                   mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2
Valiant 18.1 6 225 105 2.76 3,460 20.22 1 0 3 1

예 1: 파이프 연산자를 사용하여 변수 요약

다음 코드는 파이프 연산자( %>% )를 사용하여 cyl 변수별로 그룹화한 다음 mpg 변수의 평균 값을 요약하는 방법을 보여줍니다.

 library (dplyr)

#summarize mean mpg grouped by cyl
mtcars %>% 
  group_by(cyl) %>% 
  summarize(mean_mpg = mean(mpg))

# A tibble: 3 x 2
    cyl mean_mpg
      
1 4 26.7
2 6 19.7
3 8 15.1

결과에서 우리는 다음을 볼 수 있습니다:

실린더 값이 4인 자동차의 평균 mpg 값은 26.7 입니다.
실린더 값이 6인 자동차의 평균 mpg 값은 19.7 입니다.
실린더 값이 8인 자동차의 평균 mpg 값은 15.1 입니다.

파이프 연산자가 코드 해석을 어떻게 더 쉽게 만드는지 확인하세요.

기본적으로 그는 이렇게 말합니다.

mtcars 데이터 프레임을 가져옵니다.
cyl 변수로 그룹화하십시오.
그런 다음 mpg 변수의 평균값을 요약합니다.

예 2: 파이프 연산자를 사용하여 여러 변수를 그룹화하고 요약합니다.

다음 코드는 파이프 연산자( %>% )를 사용하여 cyl 및 am 변수를 기준으로 그룹화한 다음 mpg 변수의 평균과 hp 변수의 표준 편차를 요약하는 방법을 보여줍니다.

 library (dplyr)

#summarize mean mpg and standard dev of hp grouped by cyl and am
mtcars %>% 
  group_by(cyl, am) %>% 
  summarize(mean_mpg = mean(mpg),
            sd_hp = sd(hp))

# A tibble: 6 x 4
# Groups: cyl[3]
    cyl am mean_mpg sd_hp
        
1 4 0 22.9 19.7 
2 4 1 28.1 22.7 
3 6 0 19.1 9.18
4 6 1 20.6 37.5 
5 8 0 15.0 33.4 
6 8 1 15.4 50.2

결과에서 우리는 다음을 볼 수 있습니다:

cyl 값이 4이고 am 값이 0인 자동차의 경우 평균 mpg 값은 22.9 이고 hp 값의 표준 편차는 19.7 입니다.
cyl 값이 4이고 am 값이 1인 자동차의 경우 평균 mpg 값은 28.1 이고 hp 값의 표준 편차는 22.7 입니다.

등등.

다시 한 번, 파이프 연산자가 코드 해석을 어떻게 더 쉽게 만드는지 확인하세요.

기본적으로 그는 이렇게 말합니다.

mtcars 데이터 프레임을 가져옵니다.
cyl 및 am 변수로 그룹화합니다.
그런 다음 mpg 변수의 평균값과 hp 변수의 표준편차를 요약합니다.

예 3: 파이프 연산자를 사용하여 새 변수 생성

다음 코드는 dplyr 패키지의 mutate 함수와 함께 파이프 연산자( %>% )를 사용하여 mtcars 데이터 프레임에 두 개의 새 변수를 생성하는 방법을 보여줍니다.

 library (dplyr)

#add two new variables in mtcars
new_mtcars <- mtcars %>%
                mutate(mpg2 = mpg*2,
                       mpg_root = sqrt(mpg))

#view first six rows of new data frame
head(new_mtcars)

   mpg cyl disp hp drat wt qsec vs am gear carb mpg2 mpg_root
1 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 42.0 4.582576
2 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 42.0 4.582576
3 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 45.6 4.774935
4 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 42.8 4.626013
5 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 37.4 4.324350
6 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 36.2 4.254409

결과에서 우리는 다음을 볼 수 있습니다:

새로운 mpg2 열에는 mpg 열의 값에 2를 곱한 값이 포함됩니다.
새로운 mpg_root 열에는 mpg 열 값의 제곱근이 포함됩니다.

다시 한 번, 파이프 연산자가 코드 해석을 어떻게 더 쉽게 만드는지 확인하세요.

기본적으로 그는 이렇게 말합니다.

mtcars 데이터 프레임을 가져옵니다.
mpg2 라는 새 열과 mpg_root 라는 새 열을 만듭니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 기능을 사용하는 방법을 설명합니다.

R에서 물결표 연산자(~)를 사용하는 방법
R에서 달러 기호 연산자($)를 사용하는 방법
R에서 “NOT IN” 연산자를 사용하는 방법
R에서 %in% 연산자를 사용하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예 1: 파이프 연산자를 사용하여 변수 요약

예 2: 파이프 연산자를 사용하여 여러 변수를 그룹화하고 요약합니다.

예 3: 파이프 연산자를 사용하여 새 변수 생성

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다