A: как найти столбцы со всеми пропущенными значениями


Вы можете использовать следующие методы для поиска столбцов во фрейме данных в R, которые содержат все пропущенные значения:

Метод 1: используйте базу R

 #check if each column has all missing values
all_miss <- apply(df, 2, function (x) all(is. na (x)))

#display columns with all missing values
names(all_miss[all_miss>0])   

Способ 2. Используйте пакет purrr.

 library (purrr)

#display columns with all missing values
df %>% keep(~all(is. na (.x))) %>% names

Оба метода дают один и тот же результат, но метод «мурлыканья» имеет тенденцию быть быстрее для чрезвычайно больших кадров данных.

В следующих примерах показано, как использовать каждый метод со следующим фреймом данных в R:

 #create data frame
df <- data. frame (points=c(21, 15, 10, 4, 4, 9, 12, 10),
                 assists=c(NA, NA, NA, NA, NA, NA, NA, NA),
                 rebounds=c(8, 12, 14, 10, 7, 9, 8, 5),
                 steals=c(NA, NA, NA, NA, NA, NA, NA, NA))

#view data frame
df

  points assists rebounds steals
1 21 NA 8 NA
2 15 NA 12 NA
3 10 NA 14 NA
4 4 NA 10 NA
5 4 NA 7 NA
6 9 NA 9 NA
7 12 NA 8 NA
8 10 NA 5 NA

Пример 1. Найдите столбцы со всеми пропущенными значениями, используя Base R

Следующий код показывает, как найти столбцы во фрейме данных со всеми пропущенными значениями:

 #check if each column has all missing values
all_miss <- apply(df, 2, function (x) all(is. na (x)))

#display columns with all missing values
names(all_miss[all_miss>0])   

[1] “assists” “steals” 

Из результата мы видим, что во всех столбцах передач и перехватов отсутствуют значения.

Пример 2: Найдите столбцы со всеми пропущенными значениями с помощью пакета purrr

Следующий код показывает, как найти столбцы во фрейме данных со всеми пропущенными значениями с помощью функций из пакета purrr :

 library (purrr)

#display columns with all missing values
df %>% keep(~all(is. na (.x))) %>% names

[1] “assists” “steals” 

Из результата мы видим, что во всех столбцах передач и перехватов отсутствуют значения.

Это соответствует выходным данным базового метода R.

Дополнительные ресурсы

В следующих руководствах объясняется, как выполнять другие распространенные операции с отсутствующими значениями в R:

Как все вменить пропущенные значения в R
Как заменить NA строками в R
Как заменить NA на Zero в dplyr

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *