Odp.: jak używać drop_na do usuwania wierszy z brakującymi wartościami


Możesz użyć funkcji drop_na() z pakietu Tidyr w R, aby upuścić wiersze z brakującymi wartościami w ramce danych.

Istnieją trzy typowe sposoby korzystania z tej funkcji:

Metoda 1: Usuń wiersze z brakującymi wartościami w dowolnej kolumnie

 df %>% drop_na()

Metoda 2: Usuń wiersze z brakującymi wartościami w określonej kolumnie

 df %>% drop_na(col1)

Metoda 3: Usuń wiersze z brakującymi wartościami w jednej z kilku określonych kolumn

 df %>% drop_na(c(col1, col2))

Poniższe przykłady pokazują, jak w praktyce zastosować każdą z tych metod z następującą ramką danych:

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

Przykład 1: Usuń wiersze z brakującymi wartościami w dowolnej kolumnie

Poniższy kod pokazuje, jak użyć metody drop_na() do upuszczenia wierszy z brakującymi wartościami w dowolnej kolumnie:

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

Jedyne pozostałe wiersze to te, które nie zawierają żadnych brakujących wartości w żadnej kolumnie.

Przykład 2: Usuń wiersze z brakującymi wartościami w określonej kolumnie

Poniższy kod pokazuje, jak użyć metody drop_na() do usunięcia wierszy z brakującymi wartościami w kolumnie odrzuceń :

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

Jedyne pozostałe wiersze to te, w których nie brakuje wartości w kolumnie odrzuceń .

Przykład 3: Usuń wiersze z brakującymi wartościami w jednej z kilku określonych kolumn

Poniższy kod pokazuje, jak używać drop_na() do usuwania wierszy z brakującymi wartościami w kolumnach punktów lub asyst :

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

Jedyne pozostałe wiersze to te, w których nie brakuje wartości w kolumnach punktów lub asyst .

Uwaga: pełną dokumentację online dotyczącą metody drop_na() można znaleźć tutaj .

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak odzyskać numery linii w R
Jak dodać wiersze do ramki danych w R
Jak zastosować funkcję do każdego wiersza ramki danych w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *