Як знайти та порахувати пропущені значення в r (з прикладами)


Ви можете використовувати такі методи, щоб знайти та підрахувати відсутні значення в R:

Спосіб 1: Знайдіть розташування відсутніх значень

 which( is.na (df$column_name))

Спосіб 2: підрахуйте загальну кількість відсутніх значень

 sum( is.na (df$column_name))

Наступні приклади показують, як використовувати ці функції на практиці.

Приклад 1: знайдіть і підрахуйте пропущені значення в стовпці

Припустимо, що ми маємо наступний кадр даних:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

Ми можемо використовувати наступний код, щоб визначити позиції, які мають відсутні значення в стовпці «допомога», і знайти загальну кількість відсутніх значень у стовпці «допомога»:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

З результату ми бачимо, що на позиціях 1 , 3 і 4 відсутні значення в стовпці «асистенти», а в стовпці загалом є 3 відсутні значення.

Приклад 2: Підрахуйте пропущені значення у всіх стовпцях

Наступний код показує, як підрахувати загальну кількість відсутніх значень у кожному стовпці кадру даних:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

З результату ми бачимо:

  • У стовпці «команда» відсутнє 1 значення.
  • Стовпець «бали» містить 0 пропущених значень.
  • У стовпці «допомога» відсутні 3 значення.
  • У стовпці «підбирання» відсутнє 1 значення.

Приклад 3: підрахувати відсутні значення у всьому кадрі даних

Наступний код показує, як підрахувати загальну кількість відсутніх значень у всьому кадрі даних:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

З результату ми бачимо, що у всьому кадрі даних загалом є 5 відсутніх значень.

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові операції з відсутніми значеннями в R:

Як приписати всі відсутні значення в R
Як замінити NA рядками в R
Як замінити NA на Zero в dplyr

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *