Jak korzystać z funkcji slice() w dplyr (z przykładami)
Możesz użyć funkcji plasterek() z pakietu dplyr w R, aby utworzyć podzbiory wierszy na podstawie ich lokalizacji w postaci liczb całkowitych.
Do podzbioru określonych wierszy w ramce danych można użyć następujących metod:
Metoda 1: Podzbiór określonego wiersza
#get row 3 only
df %>% slice(3)
Metoda 2: Podzbiór wielu wierszy
#get rows 2, 5, and 6
df %>% slice(2, 5, 6)
Metoda 3: Podzbiór zakresu wierszy
#get rows 1 through 3
df %>% slice(1:3)
Metoda 4: Podstaw wiersze według grup
#get first row by group
df %>%
group_by(var1) %>%
slice(1)
Poniższe przykłady pokazują, jak używać każdej metody z następującą ramką danych:
#create dataset df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C', 'C'), points=c(1, 2, 3, 4, 5, 6, 7), assists=c(1, 5, 2, 3, 2, 2, 0)) #view dataset df team points assists 1 A 1 1 2 to 2 5 3 To 3 2 4 B 4 3 5 B 5 2 6 C 6 2 7 C 7 0
Przykład 1: podzbiór określonego wiersza
Poniższy kod pokazuje, jak używać funkcji plasterek() do zaznaczania tylko wiersza 3 w ramce danych:
#get row 3 only
df %>% slice(3)
team points assists
1 to 3 2
Przykład 2: Podzbiór wielu linii
Poniższy kod pokazuje, jak używać funkcji plasterek() do zaznaczania wielu określonych wierszy w ramce danych:
#get rows 2, 5, and 6
df %>% slice(2, 5, 6)
team points assists
1 to 2 5
2 B 5 2
3 C 6 2
Przykład 3: Podzbiór zakresu wierszy
Poniższy kod pokazuje, jak używać funkcji plasterek() do zaznaczania wszystkich wierszy od 1 do 3:
#get rows 1 through 3
df %>% slice(1:3)
team points assists
1 A 1 1
2 to 2 5
3 To 3 2
Przykład 4: Podzestaw linii według grupy
Poniższy kod pokazuje, jak używać funkcji plasterek() do zaznaczania pierwszego wiersza określonych grup:
#get first row by group
df %>%
group_by(team) %>%
slice(1)
# A tibble: 3 x 3
# Groups: team [3]
team points assists
1 A 1 1
2 B 4 3
3 C 6 2
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe funkcje za pomocą dplyr:
Jak usunąć wiersze za pomocą dplyr
Jak rozmieścić wiersze za pomocą dplyr
Jak filtrować według wielu warunków za pomocą dplyr