Jak usunąć kolumny z wartościami na w r


Możesz użyć jednej z dwóch metod, aby usunąć kolumny z ramki danych w R, które zawierają wartości NA:

Metoda 1: Użyj podstawy R

 df[, colSums(is. na (df))== 0 ]

Metoda 2: użyj dplyr

 library (dplyr)

df %>% select_if(~ !any(is. na (.)))

Obie metody dają ten sam wynik.

Poniższe przykłady pokazują, jak w praktyce zastosować każdą metodę z następującą ramką danych:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', 'D', 'E'),
                 points=c(99, NA, NA, 88, 95),
                 assists=c(33, 28, 31, 39, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 33 30
2 B NA 28 28
3 C NA 31 24
4 D 88 39 24
5 E 95 34 NA

Przykład 1: Usuń kolumny z wartościami NA przy użyciu podstawy R

Poniższy kod pokazuje jak usunąć kolumny z wartościami NA za pomocą podstawowych funkcji R:

 #define new data frame
new_df <- df[ , colSums(is. na (df))== 0 ]

#view new data frame
new_df

  team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34

Należy pamiętać, że obie kolumny z wartościami NA (punkty i zbiórki) zostały usunięte z ramki danych.

Przykład 2: Usuń kolumny z wartościami NA za pomocą dplyr

Poniższy kod pokazuje jak usunąć kolumny z wartościami NA za pomocą funkcji pakietu dplyr :

 library (dplyr)

#define new data frame
new_df <- df %>% select_if(~ !any(is. na (.)))

#view new data frame
new_df

  team assists
1 to 33
2 B 28
3 C 31
4 D 39
5 E 34

Ponownie dwie kolumny z wartościami NA (punkty i zbiórki) zostały usunięte z ramki danych.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak dodać kolumnę do ramki danych w R
Jak zmienić nazwę kolumn ramki danych w R
Jak posortować ramkę danych według kolumny w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *