Dplyrを使用してrでランダムな行を選択する方法
dplyrパッケージの関数を使用して、R のデータ フレーム内のランダムな行を選択するには、次の方法を使用できます。
方法 1: ランダムな数の行を選択する
df %>% sample_n( 5 )
この関数は、データ フレームからランダムに5行を選択します。
方法 2: 行の一部をランダムに選択する
df %>% sample_frac( .25 )
この関数は、データ フレーム内のすべての行の25%をランダムに選択します。
次の例は、R の次のデータ フレームで各メソッドを実際に使用する方法を示しています。
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
例 1: ランダムな数の行を選択する
次のコードを使用して、データ フレームから5行をランダムに選択できます。
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
データ フレームから 5 つの行がランダムに選択されることに注意してください。
例 2: 行のランダムな部分を選択する
次のコードを使用して、データ フレーム内のすべての行の25%をランダムに選択できます。
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
元のデータ フレームには合計 8 つの値があるため、8 の 25% は 2 に相当します。
したがって、データ フレームから 2 つの行がランダムに選択されます。
注: dplyr のsample_n関数とsample_frac関数の完全なドキュメントはここで見つけることができます。
追加リソース
次のチュートリアルでは、dplyr で他の一般的な操作を実行する方法を説明します。
dplyrを使用してインデックスによって列を選択する方法
dplyrを使用してグループごとに最初の行を選択する方法
dplyrを使って複数の条件でフィルタリングする方法
dplyrを使用して特定の文字列を含む行をフィルタリングする方法