Jak wybrać losowe linie w r za pomocą dplyr
Możesz użyć następujących metod, aby wybrać losowe wiersze w ramce danych w R, używając funkcji z pakietu dplyr :
Metoda 1: Wybierz losową liczbę wierszy
df %>% sample_n( 5 )
Ta funkcja losowo wybiera 5 wierszy z ramki danych.
Metoda 2: wybierz losową część wierszy
df %>% sample_frac( .25 )
Ta funkcja losowo wybiera 25% wszystkich wierszy w ramce danych.
Poniższe przykłady pokazują, jak w praktyce wykorzystać każdą metodę z następującą ramką danych w R:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
Przykład 1: Wybierz losową liczbę wierszy
Możemy użyć następującego kodu, aby losowo wybrać 5 wierszy z ramki danych:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
Należy pamiętać, że z ramki danych wybieranych jest losowo pięć wierszy.
Przykład 2: wybierz losową część wierszy
Możemy użyć następującego kodu, aby losowo wybrać 25% wszystkich wierszy w ramce danych:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
Ponieważ oryginalna ramka danych miała łącznie 8 wartości, 25% z 8 równa się 2.
W ten sposób z ramki danych wybierane są losowo dwa wiersze.
Uwaga : Pełną dokumentację funkcji sample_n i sample_frac w dplyr można znaleźć tutaj .
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe operacje w dplyr:
Jak wybrać kolumny według indeksu za pomocą dplyr
Jak wybrać pierwszy wiersz według grupy za pomocą dplyr
Jak filtrować według wielu warunków za pomocą dplyr
Jak filtrować wiersze zawierające określony ciąg za pomocą dplyr