Hoe willekeurige lijnen in r te selecteren met dplyr
U kunt de volgende methoden gebruiken om willekeurige rijen in een dataframe in R te selecteren met behulp van functies in het dplyr- pakket:
Methode 1: Selecteer een willekeurig aantal rijen
df %>% sample_n( 5 )
Deze functie selecteert willekeurig 5 rijen uit het dataframe.
Methode 2: selecteer een willekeurige fractie van rijen
df %>% sample_frac( .25 )
Deze functie selecteert willekeurig 25% van alle rijen in het dataframe.
De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
points=c(10, 10, 8, 6, 15, 15, 12, 12),
rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))
#view data frame
df
team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7
Voorbeeld 1: Selecteer een willekeurig aantal rijen
We kunnen de volgende code gebruiken om willekeurig 5 rijen uit het dataframe te selecteren:
library (dplyr)
#randomly select 5 rows from data frame
df %>% sample_n( 5 )
team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8
Merk op dat vijf rijen willekeurig uit het dataframe worden geselecteerd.
Voorbeeld 2: selecteer een willekeurige fractie van rijen
We kunnen de volgende code gebruiken om willekeurig 25% van alle rijen in het dataframe te selecteren:
library (dplyr)
#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )
team points rebounds
1 E 15 10
2 G 12 7
Omdat het oorspronkelijke dataframe 8 totale waarden had, is 25% van 8 gelijk aan 2.
Er worden dus willekeurig twee rijen uit het dataframe geselecteerd.
Opmerking : u kunt hier de volledige documentatie van de functies sample_n en sample_frac in dplyr vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in dplyr uitvoert:
Kolommen selecteren op index met behulp van dplyr
Hoe u de eerste rij per groep selecteert met dplyr
Hoe u op meerdere voorwaarden kunt filteren met behulp van dplyr
Hoe u rijen kunt filteren die een bepaalde tekenreeks bevatten met behulp van dplyr