Jak liczyć wartości inne niż na w r (3 przykłady)


Do zliczania wartości innych niż NA w R można użyć następujących metod:

Metoda 1: Zlicz wartości inne niż NA w całej ramce danych

 sum( ! is. na (df))

Metoda 2: Policz wartości inne niż NA w każdej kolumnie ramki danych

 colSums( ! is. na (df))

Metoda 3: Policz wartości inne niż NA na grupę w ramce danych

 library (dplyr)

df %>%
  group_by(var1) %>%
  summarise(total_non_na = sum( ! is. na (var2)))

Poniższy przykład pokazuje, jak w praktyce zastosować każdą z tych metod z następującą ramką danych:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, NA, 30, 32, 20, 22, 17, NA),
                 rebounds=c(10, 8, 9, 13, NA, 20, 8, 7))

#view data frame
df

  team points rebounds
1 to 12 10
2 A NA 8
3 to 30 9
4 A 32 13
5 B 20 NA
6 B 22 20
7 B 17 8
8 B NA 7

Metoda 1: Zlicz wartości inne niż NA w całej ramce danych

Poniższy kod pokazuje, jak policzyć sumę wartości innych niż NA w całej ramce danych:

 #count non-NA values in entire data frame
sum( ! is. na (df))

[1] 21

Z wyniku widzimy, że w całej ramce danych znajduje się 21 wartości innych niż NA.

Metoda 2: Policz wartości inne niż NA w każdej kolumnie ramki danych

Poniższy kod pokazuje, jak policzyć sumę wartości innych niż NA w każdej kolumnie ramki danych:

 #count non-NA values in each column
colSums( ! is. na (df))

    team points rebounds 
       8 6 7

Z wyniku możemy zobaczyć:

  • W kolumnie zespołu znajduje się 8 wartości spoza NA.
  • W kolumnie punktów znajduje się 6 wartości innych niż NA.
  • W kolumnie odrzuceń znajduje się 7 wartości innych niż NA.

Metoda 3: Policz wartości inne niż NA według grup

Poniższy kod pokazuje, jak policzyć całkowite wartości spoza NA w kolumnie punktów , pogrupowane według kolumny zespołu :

 library (dplyr)
df %>%
  group_by(team) %>%
  summarise(total_non_na = sum( ! is. na (points)))

# A tibble: 2 x 2
  team total_non_na
          
1 to 3
2 B 3

Z wyniku możemy zobaczyć:

  • W kolumnie punktów dla Drużyny A znajdują się 3 wartości spoza NA.
  • W kolumnie punktów dla Drużyny B znajdują się 3 wartości spoza NA.

Dodatkowe zasoby

Poniższe tutoriale wyjaśniają jak wykonać inne typowe operacje na brakujących wartościach w R:

Jak znaleźć i policzyć brakujące wartości w R
Jak wszystkim przypisać brakujące wartości w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *