Jak policzyć liczbę wystąpień w kolumnach w r
Możesz użyć następującej składni w R, aby policzyć liczbę wystąpień określonych wartości w kolumnach ramki danych:
#count number of occurrences of each value in column table(df$column_name) #count number of occurrences of each value (including NA values) in column table(df$column_name, useNA = ' always ') #count number of occurrences of specific value length(which(df$column_name== value ))
Poniższe przykłady pokazują, jak zastosować tę składnię w praktyce z następującą ramką danych:
#create data frame df <- data. frame (player=c('A', 'B', 'C', 'D', 'E', 'F'), team=c('Mavs', 'Mavs', 'Suns', 'Nets', 'Nets', 'Nets'), points=c(20, 22, 26, 30, 30, NA)) #view data frame df player team points 1 A Mavs 20 2 B Mavs 22 3 C Suns 26 4 D Nets 30 5 E Nets 30 6 F Nets NA
Przykład 1: Zlicz wystąpienia wartości w kolumnie
Poniższy kod pokazuje, jak policzyć liczbę wystąpień każdej wartości w kolumnie „zespół”:
#count number of occurrences of each team
table(df$team)
Mavs Nets Suns
2 3 1
To nam mówi:
- Nazwa zespołu „Mavs” pojawia się 2 razy.
- Nazwa zespołu „Nets” pojawia się 3 razy.
- Nazwa zespołu „Suns” pojawia się 1 raz.
Przykład 2: Zliczanie wystąpień wartości w kolumnie (w tym wartości NA)
Poniższy kod pokazuje, jak policzyć liczbę wystąpień każdej wartości (w tym wartości NA) w kolumnie „punkty”:
#count number of occurrences of each value in 'points', including NA occurrences table(df$points, useNA = ' always ') 20 22 26 30 <NA> 1 1 1 2 1
To nam mówi:
- Wartość 20 pojawia się 1 raz.
- Wartość 22 pojawia się 1 raz.
- Wartość 26 pojawia się 1 raz.
- Wartość 30 pojawia się dwukrotnie.
- Wartość NA (brakująca wartość) pojawia się 1 raz.
Przykład 3: Zliczanie wystąpień określonej wartości w kolumnie
Poniższy kod pokazuje jak policzyć ilość wystąpień wartości 30 w kolumnie „punkty”:
#count number of occurrences of the value 30 in 'points' column length(which(df$points == 30 )) [1] 2
Oznacza to, że wartość 30 pojawia się dwukrotnie w kolumnie „punkty”.
Możesz także użyć poniższej składni, aby policzyć liczbę wystąpień kilku różnych wartości w kolumnie „punkty”:
#count number of occurrences of the value 30 or 26 in 'points' column length(which(df$points == 30 | df$points == 26 )) [1] 3
Oznacza to, że wartość 30 lub 26 pojawia się w sumie 3 razy w kolumnie „punkty”.
Dodatkowe zasoby
Jak sumować określone kolumny w R
Jak obliczyć średnią z wielu kolumn w R
Jak znaleźć maksymalną wartość w wielu kolumnach w R