Як вибрати випадкові рядки в r за допомогою dplyr
Ви можете використовувати наступні методи для вибору випадкових рядків у кадрі даних у R за допомогою функцій у пакеті dplyr :
Спосіб 1: виберіть випадкову кількість рядків
df %>% sample_n( 5 )
Ця функція випадковим чином вибирає 5 рядків із кадру даних.
Спосіб 2: виберіть довільну частину рядків
df %>% sample_frac( .25 )
Ця функція випадковим чином вибирає 25% усіх рядків у кадрі даних.
У наведених нижче прикладах показано, як використовувати кожен метод на практиці з таким кадром даних у R:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
Приклад 1: Виберіть випадкову кількість рядків
Ми можемо використовувати наступний код, щоб випадковим чином вибрати 5 рядків із кадру даних:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
Зверніть увагу, що п’ять рядків випадковим чином вибираються з кадру даних.
Приклад 2: вибрати випадкову частку рядків
Ми можемо використати такий код, щоб випадковим чином вибрати 25% усіх рядків у фреймі даних:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
Оскільки вихідний фрейм даних мав 8 значень, 25% від 8 дорівнює 2.
Таким чином, із кадру даних випадковим чином вибираються два рядки.
Примітка . Ви можете знайти повну документацію щодо функцій sample_n і sample_frac у dplyr тут .
Додаткові ресурси
У наступних посібниках пояснюється, як виконувати інші типові операції в dplyr:
Як вибрати стовпці за індексом за допомогою dplyr
Як вибрати перший рядок групою за допомогою dplyr
Як фільтрувати за кількома умовами за допомогою dplyr
Як фільтрувати рядки, що містять певний рядок, за допомогою dplyr