Dplyrを使用してrでランダムな行を選択する方法


dplyrパッケージの関数を使用して、R のデータ フレーム内のランダムな行を選択するには、次の方法を使用できます。

方法 1: ランダムな数の行を選択する

 df %>% sample_n( 5 )

この関数は、データ フレームからランダムに5行を選択します。

方法 2: 行の一部をランダムに選択する

 df %>% sample_frac( .25 )

この関数は、データ フレーム内のすべての行の25%をランダムに選択します。

次の例は、R の次のデータ フレームで各メソッドを実際に使用する方法を示しています。

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
                 rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7

例 1: ランダムな数の行を選択する

次のコードを使用して、データ フレームから5行をランダムに選択できます。

 library (dplyr)

#randomly select 5 rows from data frame
df %>% sample_n( 5 )

  team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8

データ フレームから 5 つの行がランダムに選択されることに注意してください。

例 2: 行のランダムな部分を選択する

次のコードを使用して、データ フレーム内のすべての行の25%をランダムに選択できます。

 library (dplyr)

#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )

  team points rebounds
1 E 15 10
2 G 12 7

元のデータ フレームには合計 8 つの値があるため、8 の 25% は 2 に相当します。

したがって、データ フレームから 2 つの行がランダムに選択されます。

: dplyr のsample_n関数とsample_frac関数の完全なドキュメントはここで見つけることができます。

追加リソース

次のチュートリアルでは、dplyr で他の一般的な操作を実行する方法を説明します。

dplyrを使用してインデックスによって列を選択する方法
dplyrを使用してグループごとに最初の行を選択する方法
dplyrを使って複数の条件でフィルタリングする方法
dplyrを使用して特定の文字列を含む行をフィルタリングする方法

コメントを追加する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です