Dplyr을 사용하여 r에서 임의의 선을 선택하는 방법


dplyr 패키지의 함수를 사용하여 R의 데이터 프레임에서 임의의 행을 선택하려면 다음 방법을 사용할 수 있습니다.

방법 1: 임의의 행 수 선택

 df %>% sample_n( 5 )

이 함수는 데이터 프레임에서 5개의 행을 무작위로 선택합니다.

방법 2: 행의 무작위 부분 선택

 df %>% sample_frac( .25 )

이 함수는 데이터 프레임에 있는 모든 행의 25%를 무작위로 선택합니다.

다음 예에서는 R의 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
                 rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7

예 1: 임의 개수의 행 선택

다음 코드를 사용하여 데이터 프레임에서 5개의 행을 무작위로 선택할 수 있습니다.

 library (dplyr)

#randomly select 5 rows from data frame
df %>% sample_n( 5 )

  team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8

데이터 프레임에서 5개의 행이 무작위로 선택됩니다.

예 2: 행의 무작위 부분 선택

다음 코드를 사용하여 데이터 프레임에 있는 모든 행의 25% 를 무작위로 선택할 수 있습니다.

 library (dplyr)

#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )

  team points rebounds
1 E 15 10
2 G 12 7

원래 데이터 프레임에는 총 8개의 값이 있으므로 8의 25%는 2와 같습니다.

따라서 데이터 프레임에서 두 개의 행이 무작위로 선택됩니다.

참고 : 여기 에서 dplyr의 Sample_nSample_frac 함수에 대한 전체 문서를 찾을 수 있습니다.

추가 리소스

다음 튜토리얼에서는 dplyr에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.

dplyr을 사용하여 인덱스로 열을 선택하는 방법
dplyr을 사용하여 그룹별로 첫 번째 행을 선택하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
dplyr을 사용하여 특정 문자열이 포함된 행을 필터링하는 방법

의견을 추가하다

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다