Dplyr을 사용하여 r에서 임의의 선을 선택하는 방법

에 의해 벤자민 앤더슨 7월 20, 2023 가이드 댓글 0개

dplyr 패키지의 함수를 사용하여 R의 데이터 프레임에서 임의의 행을 선택하려면 다음 방법을 사용할 수 있습니다.

방법 1: 임의의 행 수 선택

 df %>% sample_n( 5 )

이 함수는 데이터 프레임에서 5개의 행을 무작위로 선택합니다.

방법 2: 행의 무작위 부분 선택

 df %>% sample_frac( .25 )

이 함수는 데이터 프레임에 있는 모든 행의 25%를 무작위로 선택합니다.

다음 예에서는 R의 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
                 rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7

예 1: 임의 개수의 행 선택

다음 코드를 사용하여 데이터 프레임에서 5개의 행을 무작위로 선택할 수 있습니다.

 library (dplyr)

#randomly select 5 rows from data frame
df %>% sample_n( 5 )

  team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8

데이터 프레임에서 5개의 행이 무작위로 선택됩니다.

예 2: 행의 무작위 부분 선택

다음 코드를 사용하여 데이터 프레임에 있는 모든 행의 25% 를 무작위로 선택할 수 있습니다.

 library (dplyr)

#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )

  team points rebounds
1 E 15 10
2 G 12 7

원래 데이터 프레임에는 총 8개의 값이 있으므로 8의 25%는 2와 같습니다.

따라서 데이터 프레임에서 두 개의 행이 무작위로 선택됩니다.

참고 : 여기 에서 dplyr의 Sample_n 및 Sample_frac 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 dplyr에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

dplyr을 사용하여 인덱스로 열을 선택하는 방법
dplyr을 사용하여 그룹별로 첫 번째 행을 선택하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
dplyr을 사용하여 특정 문자열이 포함된 행을 필터링하는 방법

저자 소개

벤자민 앤더슨

안녕하세요. 저는 통계학 교수를 퇴직하고 전임 통계 교사로 변신한 벤자민입니다. 통계 분야의 광범위한 경험과 전문 지식을 바탕으로 Statorials를 통해 학생들에게 힘을 실어주기 위해 지식을 공유하고 싶습니다. 더 알아보기

예 1: 임의 개수의 행 선택

예 2: 행의 무작위 부분 선택

추가 리소스

저자 소개

벤자민 앤더슨

의견을 추가하다