Hoe willekeurige lijnen in r te selecteren met dplyr


U kunt de volgende methoden gebruiken om willekeurige rijen in een dataframe in R te selecteren met behulp van functies in het dplyr- pakket:

Methode 1: Selecteer een willekeurig aantal rijen

 df %>% sample_n( 5 )

Deze functie selecteert willekeurig 5 rijen uit het dataframe.

Methode 2: selecteer een willekeurige fractie van rijen

 df %>% sample_frac( .25 )

Deze functie selecteert willekeurig 25% van alle rijen in het dataframe.

De volgende voorbeelden laten zien hoe u elke methode in de praktijk kunt gebruiken met het volgende dataframe in R:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E', 'F', 'G', 'H'),
                 points=c(10, 10, 8, 6, 15, 15, 12, 12),
                 rebounds=c(8, 8, 4, 3, 10, 11, 7, 7))

#view data frame
df

  team points rebounds
1 to 10 8
2 B 10 8
3 C 8 4
4 D 6 3
5 E 15 10
6 F 15 11
7 G 12 7
8:12 a.m. 7

Voorbeeld 1: Selecteer een willekeurig aantal rijen

We kunnen de volgende code gebruiken om willekeurig 5 rijen uit het dataframe te selecteren:

 library (dplyr)

#randomly select 5 rows from data frame
df %>% sample_n( 5 )

  team points rebounds
1 F 15 11
2 to 10 8
3 D 6 3
4 G 12 7
5 B 10 8

Merk op dat vijf rijen willekeurig uit het dataframe worden geselecteerd.

Voorbeeld 2: selecteer een willekeurige fractie van rijen

We kunnen de volgende code gebruiken om willekeurig 25% van alle rijen in het dataframe te selecteren:

 library (dplyr)

#randomly select 25% of all rows from data frame
df %>% sample_frac( .25 )

  team points rebounds
1 E 15 10
2 G 12 7

Omdat het oorspronkelijke dataframe 8 totale waarden had, is 25% van 8 gelijk aan 2.

Er worden dus willekeurig twee rijen uit het dataframe geselecteerd.

Opmerking : u kunt hier de volledige documentatie van de functies sample_n en sample_frac in dplyr vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende bewerkingen in dplyr uitvoert:

Kolommen selecteren op index met behulp van dplyr
Hoe u de eerste rij per groep selecteert met dplyr
Hoe u op meerdere voorwaarden kunt filteren met behulp van dplyr
Hoe u rijen kunt filteren die een bepaalde tekenreeks bevatten met behulp van dplyr

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert