Як порахувати не-na значення в r (3 приклади)


Ви можете використовувати наступні методи для підрахунку не-NA значень у R:

Спосіб 1: Підрахуйте значення, що не є NA, у всьому кадрі даних

 sum( ! is. na (df))

Спосіб 2: Підрахуйте не-NA значення в кожному стовпці кадру даних

 colSums( ! is. na (df))

Спосіб 3: підрахунок не-NA значень на групу в кадрі даних

 library (dplyr)

df %>%
  group_by(var1) %>%
  summarise(total_non_na = sum( ! is. na (var2)))

У наступному прикладі показано, як використовувати кожен із цих методів на практиці з таким кадром даних:

 #create data frame
df <- data. frame (team=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B'),
                 points=c(12, NA, 30, 32, 20, 22, 17, NA),
                 rebounds=c(10, 8, 9, 13, NA, 20, 8, 7))

#view data frame
df

  team points rebounds
1 to 12 10
2 A NA 8
3 to 30 9
4 A 32 13
5 B 20 NA
6 B 22 20
7 B 17 8
8 B NA 7

Спосіб 1: Підрахуйте значення, що не є NA, у всьому кадрі даних

Наступний код показує, як підрахувати загальну кількість значень, які не є NA, у всьому кадрі даних:

 #count non-NA values in entire data frame
sum( ! is. na (df))

[1] 21

З результату ми бачимо, що у всьому кадрі даних є 21 значення, яке не є NA.

Спосіб 2: Підрахуйте не-NA значення в кожному стовпці кадру даних

Наступний код показує, як підрахувати загальну кількість значень, які не є NA, у кожному стовпці кадру даних:

 #count non-NA values in each column
colSums( ! is. na (df))

    team points rebounds 
       8 6 7

З результату ми бачимо:

  • У стовпці команди є 8 значень, які не є NA.
  • У стовпчику балів є 6 значень, які не є NA.
  • У стовпці відмов є 7 не-NA значень.

Спосіб 3: підрахунок не-NA значень за групою

У наведеному нижче коді показано, як підрахувати загальні значення, які не є NA, у стовпці балів , згрупованих за стовпцем team :

 library (dplyr)
df %>%
  group_by(team) %>%
  summarise(total_non_na = sum( ! is. na (points)))

# A tibble: 2 x 2
  team total_non_na
          
1 to 3
2 B 3

З результату ми бачимо:

  • У колонці очок для команди A є 3 значення, відмінні від NA.
  • У колонці очок для команди B є 3 значення, відмінні від NA.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції з відсутніми значеннями в R:

Як знайти і порахувати відсутні значення в R
Як приписати всі відсутні значення в R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *