A: як використовувати drop_na для видалення рядків із відсутніми значеннями


Ви можете використовувати функцію drop_na() з пакету Tidyr у R, щоб відкинути рядки з відсутніми значеннями у кадрі даних.

Є три поширені способи використання цієї функції:

Спосіб 1: Видаліть рядки з відсутніми значеннями в будь-якому стовпці

 df %>% drop_na()

Спосіб 2: Видаліть рядки з відсутніми значеннями в певному стовпці

 df %>% drop_na(col1)

Спосіб 3: Видаліть рядки з відсутніми значеннями в одному з кількох конкретних стовпців

 df %>% drop_na(c(col1, col2))

У наведених нижче прикладах показано, як використовувати кожен із цих методів на практиці з таким кадром даних:

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

Приклад 1: видаліть рядки з відсутніми значеннями в будь-якому стовпці

Наступний код показує, як використовувати drop_na() для видалення рядків із відсутніми значеннями в будь-якому стовпці:

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

Залишилися лише ті рядки, які не містять пропущених значень у жодному стовпці.

Приклад 2: видаліть рядки з відсутніми значеннями в певному стовпці

Наступний код показує, як використовувати drop_na() , щоб видалити рядки з відсутніми значеннями в стовпці відмов :

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

Залишилися лише ті рядки, у яких немає пропущених значень у стовпці відмов .

Приклад 3: видаліть рядки з відсутніми значеннями в одному з кількох конкретних стовпців

Наступний код показує, як використовувати drop_na() для видалення рядків із відсутніми значеннями в стовпцях балів або допоміжних засобів:

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

Єдині рядки, що залишилися, це ті, у яких немає пропущених значень у стовпцях очок або передач .

Примітка. Ви можете знайти повну онлайн-документацію для методу drop_na() тут .

Додаткові ресурси

У наступних посібниках пояснюється, як виконувати інші типові завдання в R:

Як отримати номери рядків у R
Як додати рядки до кадру даних у R
Як застосувати функцію до кожного рядка кадру даних у R

Додати коментар

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *