Dplyr을 사용하여 r에서 임의의 선을 선택하는 방법
dplyr 패키지의 함수를 사용하여 R의 데이터 프레임에서 임의의 행을 선택하려면 다음 방법을 사용할 수 있습니다.
방법 1: 임의의 행 수 선택
df %>% sample_n( 5 )
이 함수는 데이터 프레임에서 5개의 행을 무작위로 선택합니다.
방법 2: 행의 무작위 부분 선택
df %>% sample_frac( .25 )
이 함수는 데이터 프레임에 있는 모든 행의 25%를 무작위로 선택합니다.
다음 예에서는 R의 다음 데이터 프레임을 사용하여 실제로 각 메서드를 사용하는 방법을 보여줍니다.
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
예 1: 임의 개수의 행 선택
다음 코드를 사용하여 데이터 프레임에서 5개의 행을 무작위로 선택할 수 있습니다.
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
데이터 프레임에서 5개의 행이 무작위로 선택됩니다.
예 2: 행의 무작위 부분 선택
다음 코드를 사용하여 데이터 프레임에 있는 모든 행의 25% 를 무작위로 선택할 수 있습니다.
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
원래 데이터 프레임에는 총 8개의 값이 있으므로 8의 25%는 2와 같습니다.
따라서 데이터 프레임에서 두 개의 행이 무작위로 선택됩니다.
참고 : 여기 에서 dplyr의 Sample_n 및 Sample_frac 함수에 대한 전체 문서를 찾을 수 있습니다.
추가 리소스
다음 튜토리얼에서는 dplyr에서 다른 일반적인 작업을 수행하는 방법을 설명합니다.
dplyr을 사용하여 인덱스로 열을 선택하는 방법
dplyr을 사용하여 그룹별로 첫 번째 행을 선택하는 방법
dplyr을 사용하여 여러 조건으로 필터링하는 방법
dplyr을 사용하여 특정 문자열이 포함된 행을 필터링하는 방법