Jak podzielić ramkę danych w r (4 przykłady)

Przez Benjamin Anderson 24 lipca, 2023 Przewodnik 0 komentarzy

Do podzbioru ramki danych w R można użyć następującej podstawowej składni:

 df[rows, columns]

Poniższe przykłady pokazują, jak zastosować tę składnię w praktyce z następującą ramką danych:

 #create data frame
df <- data. frame (team=c('A', 'A', 'B', 'B', 'C', 'C', 'C'),
                 points=c(77, 81, 89, 83, 99, 92, 97),
                 assists=c(19, 22, 29, 15, 32, 39, 14))

#view data frame
df

  team points assists
1 A 77 19
2 A 81 22
3 B 89 29
4 B 83 15
5 C 99 32
6 C 92 39
7 C 97 14

Przykład 1: Podzbiór ramki danych poprzez wybranie kolumn

Poniższy kod pokazuje, jak podzielić ramkę danych na podstawie nazw kolumn:

 #select all rows for columns 'team' and 'assists'
df[, c(' team ', ' assists ')]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Możemy również podzielić ramkę danych według wartości indeksów kolumn:

 #select all rows for columns 1 and 3
df[, c(1, 3)]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Przykład 2: Podzbiór ramki danych z wyłączeniem kolumn

Poniższy kod pokazuje, jak podzielić ramkę danych na podzbiór, wykluczając określone nazwy kolumn:

 #define columns to exclude
cols <- names(df) %in% c(' points ')

#exclude points column
df[!cols]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Możemy również wykluczyć kolumny, korzystając z wartości indeksów

 #exclude column 2
df[, c(-2)]

  team assists
1 to 19
2 to 22
3 B 29
4 B 15
5 C 32
6 C 39
7 C 14

Przykład 3: Podzbiór ramki danych poprzez wybranie wierszy

Poniższy kod pokazuje, jak podzielić ramkę danych na podzbiór według określonych wierszy:

 #select rows 1, 5, and 7
df[c(1, 5, 7), ]

  team points assists
1 A 77 19
5 C 99 32
7 C 97 14

Możemy również podzielić ramkę danych, wybierając zakres wierszy:

 #select rows 1 through 5
df[1:5, ]

  team points assists
1 A 77 19
2 A 81 22
3 B 89 29
4 B 83 15
5 C 99 32

Przykład 4: Podzbiór ramki danych w oparciu o warunki

Poniższy kod pokazuje, jak używać funkcji subset() do wybierania wierszy i kolumn spełniających określone warunki:

 #select rows where points is greater than 90
subset(df, points > 90)

  team points assists
5 C 99 32
6 C 92 39
7 C 97 14

Możemy także użyć | Operator („lub”) wybierający wiersze spełniające jeden z poniższych warunków:

 #select rows where points is greater than 90 or less than 80
subset(df, points > 90 | points < 80)

  team points assists
1 A 77 19
5 C 99 32
6 C 92 39
7 C 97 14

Możemy także użyć operatora & („i”), aby wybrać wiersze spełniające wiele warunków:

 #select rows where points is greater than 90 and assists is greater than 30
subset(df, points > 90 & assists > 30)

  team points assists
5 C 99 32
6 C 92 39

Możemy również użyć argumentu Select, aby wybrać tylko określone kolumny na podstawie warunku:

 #select rows where points is greater than 90 and only show 'team' column
subset(df, points > 90, select=c(' team '))

  team
5C
6C
7C

Dodatkowe zasoby

Jak usunąć wiersze z ramki danych w R na podstawie warunku
Jak zamienić wartości w ramce danych w R
Jak usunąć kolumny z ramki danych w R

o autorze

Dr Benjamin Anderson

Cześć, jestem Benjamin i jestem emerytowanym profesorem statystyki, który został oddanym nauczycielem Statorials. Dzięki bogatemu doświadczeniu i wiedzy specjalistycznej w dziedzinie statystyki chętnie dzielę się swoją wiedzą, aby wzmocnić pozycję uczniów za pośrednictwem Statorials. Wiedzieć więcej