Jak policzyć liczbę wystąpień w kolumnach w r


Możesz użyć następującej składni w R, aby policzyć liczbę wystąpień określonych wartości w kolumnach ramki danych:

 #count number of occurrences of each value in column
table(df$column_name)

#count number of occurrences of each value (including NA values) in column
table(df$column_name, useNA = ' always ')

#count number of occurrences of specific value
length(which(df$column_name== value ))

Poniższe przykłady pokazują, jak zastosować tę składnię w praktyce z następującą ramką danych:

 #create data frame
df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'),
                 points=c(20, 22, 26, 30, 30, NA))

#view data frame
df

  player team points
1 A Mavs 20
2 B Mavs 22
3 C Suns 26
4 D Nets 30
5 E Nets 30
6 F Nets NA

Przykład 1: Zlicz wystąpienia wartości w kolumnie

Poniższy kod pokazuje, jak policzyć liczbę wystąpień każdej wartości w kolumnie „zespół”:

 #count number of occurrences of each team
table(df$team)

Mavs Nets Suns 
   2 3 1 

To nam mówi:

  • Nazwa zespołu „Mavs” pojawia się 2 razy.
  • Nazwa zespołu „Nets” pojawia się 3 razy.
  • Nazwa zespołu „Suns” pojawia się 1 raz.

Przykład 2: Zliczanie wystąpień wartości w kolumnie (w tym wartości NA)

Poniższy kod pokazuje, jak policzyć liczbę wystąpień każdej wartości (w tym wartości NA) w kolumnie „punkty”:

 #count number of occurrences of each value in 'points', including NA occurrences
table(df$points, useNA = ' always ')

  20 22 26 30 <NA>
   1 1 1 2 1

To nam mówi:

  • Wartość 20 pojawia się 1 raz.
  • Wartość 22 pojawia się 1 raz.
  • Wartość 26 pojawia się 1 raz.
  • Wartość 30 pojawia się dwukrotnie.
  • Wartość NA (brakująca wartość) pojawia się 1 raz.

Przykład 3: Zliczanie wystąpień określonej wartości w kolumnie

Poniższy kod pokazuje jak policzyć ilość wystąpień wartości 30 w kolumnie „punkty”:

 #count number of occurrences of the value 30 in 'points' column
length(which(df$points == 30 ))

[1] 2

Oznacza to, że wartość 30 pojawia się dwukrotnie w kolumnie „punkty”.

Możesz także użyć poniższej składni, aby policzyć liczbę wystąpień kilku różnych wartości w kolumnie „punkty”:

 #count number of occurrences of the value 30 or 26 in 'points' column
length(which(df$points == 30 | df$points == 26 ))

[1] 3

Oznacza to, że wartość 30 lub 26 pojawia się w sumie 3 razy w kolumnie „punkty”.

Dodatkowe zasoby

Jak sumować określone kolumny w R
Jak obliczyć średnią z wielu kolumn w R
Jak znaleźć maksymalną wartość w wielu kolumnach w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *