Como subconjunto de um quadro de dados por níveis de fator em r
Você pode usar qualquer um dos seguintes métodos para criar subconjuntos de um quadro de dados por níveis de fator em R:
Método 1: subconjunto por nível de um fator
#subset rows where team is equal to 'B' df_sub <- df[df$team == ' B ', ]
Método 2: subconjunto por níveis de múltiplos fatores
#subset rows where team is equal to 'A' or 'C'
df_sub <- df[df$team %in% c(' A ', ' C '), ]
Os exemplos a seguir mostram como usar cada um desses métodos na prática com o seguinte quadro de dados em R:
#create data frame
df <- data. frame (team=factor(c('A', 'A', 'B', 'B', 'B', 'C')),
dots=c(22, 35, 19, 15, 29, 23))
#view data frame
df
team points
1 to 22
2 to 35
3 B 19
4 B 15
5 B 29
6 C 23
Método 1: subconjunto por nível de um fator
O código a seguir mostra como criar um novo quadro de dados dividido em subconjuntos por linhas onde o valor na coluna da equipe é igual a “B”:
#subset rows where team is equal to 'B' df_sub <- df[df$team == ' B ', ] #view updated data frame df_sub team points 3 B 19 4 B 15 5 B 29
Observe que o novo quadro de dados contém apenas linhas cujo valor na coluna da equipe é igual a “B”.
Exemplo 2: subconjunto por vários níveis de fatores
O código a seguir mostra como criar um novo quadro de dados dividido em subconjuntos por linhas onde o valor na coluna da equipe é igual a “A” ou “C”:
#subset rows where team is equal to 'A' or 'C' df_sub <- df[df$team %in% c(' A ', ' C '), ] #view updated data frame df_sub team points 1 to 22 2 to 35 6 C 23
Observe que o novo quadro de dados contém apenas linhas cujo valor na coluna da equipe é igual a “A” ou “C”.
Usando esta sintaxe, você pode incluir quantos níveis de fator desejar no vetor seguindo o operador %in% para subconfigurar ainda mais níveis de fator.
Relacionado: Como usar o operador% in% em R (com exemplos)
Recursos adicionais
Os tutoriais a seguir explicam como realizar outras tarefas comuns em R:
Como converter um fator em numérico em R
Como converter fator em caractere em R
Como reorganizar os níveis dos fatores em R