Como contar o número de ocorrências em colunas em r


Você pode usar a seguinte sintaxe em R para contar o número de ocorrências de determinados valores nas colunas de um quadro de dados:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

Os exemplos a seguir mostram como usar essa sintaxe na prática com o seguinte quadro de dados:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

Exemplo 1: Contar ocorrências de valores na coluna

O código a seguir mostra como contar o número de ocorrências de cada valor na coluna “equipe”:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

Isso nos diz:

  • O nome da equipe “Mavs” aparece 2 vezes.
  • O nome do time “Nets” aparece 3 vezes.
  • O nome do time “Suns” aparece 1 vez.

Exemplo 2: Contar ocorrências de valores na coluna (incluindo valores NA)

O código a seguir mostra como contar o número de ocorrências de cada valor (incluindo valores NA) na coluna “pontos”:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

Isso nos diz:

  • O valor 20 aparece 1 vez.
  • O valor 22 aparece 1 vez.
  • O valor 26 aparece 1 vez.
  • O valor 30 aparece duas vezes.
  • O valor NA (valor faltante) aparece 1 vez.

Exemplo 3: Contar ocorrências de um valor específico na coluna

O código a seguir mostra como contar o número de ocorrências do valor 30 na coluna “pontos”:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

Isto nos diz que o valor 30 aparece duas vezes na coluna ‘pontos’.

Você também pode usar a seguinte sintaxe para contar o número de ocorrências de vários valores diferentes na coluna “pontos”:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

Isso nos diz que o valor 30 ou 26 aparece um total de 3 vezes na coluna “pontos”.

Recursos adicionais

Como somar colunas específicas em R
Como calcular a média de múltiplas colunas em R
Como encontrar o valor máximo em várias colunas em R

Add a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *