Dplyr에서 ungroup()을 사용하는 방법(예제 포함)

에 의해 벤자민 앤더슨 7월 16, 2023 가이드 댓글 0개

group_by() 함수를 사용하여 그룹당 하나의 변수를 요약한 후 dplyr의 ungroup () 함수를 사용하여 행의 그룹을 해제할 수 있습니다.

다음 예에서는 이 기능을 실제로 사용하는 방법을 보여줍니다.

예: dplyr에서 ungroup()을 사용하는 방법

R에 다음과 같은 데이터 프레임이 있다고 가정합니다.

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'B'),
                 dots=c(14, 18, 22, 26, 36, 34),
                 assists=c(5, 4, 4, 8, 7, 3))

#view data frame
df

  team points assists
1 to 14 5
2 to 18 4
3 to 22 4
4 B 26 8
5 B 36 7
6 B 34 3

이제 다음 코드를 사용하여 팀별 로 그룹화된 평균 점수 값을 계산한다고 가정합니다.

 library (dplyr)

#calculate mean of points, grouped by team
df_new <- df %>%
            group_by(team) %>%
            summarize(mean_points = mean(points)) %>%
            A group()

#view results
df_new

# A tibble: 2 x 2
  team mean_points
         
1 to 18
2 B 32

이 구문을 사용하면 팀별 로 그룹화된 포인트 의 평균 값을 계산할 수 있지만 어시스트 열이 손실되었습니다.

도우미 열을 유지하려면 summary() 대신 mutate()를 사용하고 마지막에는 ungroup()을 계속 사용할 수 있습니다.

 library (dplyr)

#calculate mean of points, grouped by team
df_new <- df %>%
            group_by(team) %>%
            mutate(mean_points = mean(points)) %>%
            A group()

#view results
df_new

# A tibble: 6 x 4
  team points assists mean_points
              
1 A 14 5 18
2 A 18 4 18
3 A 22 4 18
4 B 26 8 32
5 B 36 7 32
6 B 34 3 32

이번에는 어시스트 열을 유지할 수 있으며 mutate() 함수를 사용하여 각 팀의 평균 점수 값을 표시하는 Mean_points 라는 새 열을 추가했습니다.

ungroup() 함수도 사용했기 때문에 그룹화된 변수의 영향을 받는 계산에 대해 걱정하지 않고 이 새 데이터 프레임에서 계산을 수행할 수 있습니다.

ungroup() 함수를 사용하지 않으면 데이터 프레임의 행이 계속 그룹화되어 나중에 다른 계산을 수행할 때 의도하지 않은 결과가 발생할 수 있습니다.

추가 리소스

다음 튜토리얼에서는 R에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

dplyr을 사용하여 고유 값을 필터링하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
R의 열에서 발생 횟수를 계산하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예: dplyr에서 ungroup()을 사용하는 방법

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다