A: как найти столбцы со всеми пропущенными значениями
Вы можете использовать следующие методы для поиска столбцов во фрейме данных в R, которые содержат все пропущенные значения:
Метод 1: используйте базу R
#check if each column has all missing values all_miss <- apply(df, 2, function (x) all(is. na (x))) #display columns with all missing values names(all_miss[all_miss>0])
Способ 2. Используйте пакет purrr.
library (purrr) #display columns with all missing values df %>% keep(~all(is. na (.x))) %>% names
Оба метода дают один и тот же результат, но метод «мурлыканья» имеет тенденцию быть быстрее для чрезвычайно больших кадров данных.
В следующих примерах показано, как использовать каждый метод со следующим фреймом данных в R:
#create data frame
df <- data. frame (points=c(21, 15, 10, 4, 4, 9, 12, 10),
assists=c(NA, NA, NA, NA, NA, NA, NA, NA),
rebounds=c(8, 12, 14, 10, 7, 9, 8, 5),
steals=c(NA, NA, NA, NA, NA, NA, NA, NA))
#view data frame
df
points assists rebounds steals
1 21 NA 8 NA
2 15 NA 12 NA
3 10 NA 14 NA
4 4 NA 10 NA
5 4 NA 7 NA
6 9 NA 9 NA
7 12 NA 8 NA
8 10 NA 5 NA
Пример 1. Найдите столбцы со всеми пропущенными значениями, используя Base R
Следующий код показывает, как найти столбцы во фрейме данных со всеми пропущенными значениями:
#check if each column has all missing values all_miss <- apply(df, 2, function (x) all(is. na (x))) #display columns with all missing values names(all_miss[all_miss>0]) [1] “assists” “steals”
Из результата мы видим, что во всех столбцах передач и перехватов отсутствуют значения.
Пример 2: Найдите столбцы со всеми пропущенными значениями с помощью пакета purrr
Следующий код показывает, как найти столбцы во фрейме данных со всеми пропущенными значениями с помощью функций из пакета purrr :
library (purrr) #display columns with all missing values df %>% keep(~all(is. na (.x))) %>% names [1] “assists” “steals”
Из результата мы видим, что во всех столбцах передач и перехватов отсутствуют значения.
Это соответствует выходным данным базового метода R.
Дополнительные ресурсы
В следующих руководствах объясняется, как выполнять другие распространенные операции с отсутствующими значениями в R:
Как все вменить пропущенные значения в R
Как заменить NA строками в R
Как заменить NA на Zero в dplyr