Jak znaleźć i policzyć brakujące wartości w r (z przykładami)


Aby znaleźć i policzyć brakujące wartości w R, możesz użyć następujących metod:

Metoda 1: Znajdź lokalizację brakujących wartości

 which( is.na (df$column_name))

Metoda 2: Policz wszystkie brakujące wartości

 sum( is.na (df$column_name))

Poniższe przykłady pokazują, jak wykorzystać te funkcje w praktyce.

Przykład 1: Znajdź i zlicz brakujące wartości w kolumnie

Załóżmy, że mamy następującą ramkę danych:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#view data frame
df

  team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA

Możemy użyć poniższego kodu, aby zidentyfikować pozycje, które mają braki danych w kolumnie „pomoc” i znaleźć łączną liczbę brakujących wartości w kolumnie „pomoc”:

 #identify locations of missing values in 'assists' column
which( is.na (df$assists))

[1] 1 3 4

#count total missing values in 'assists' column
sum( is.na (df$assists))

[1] 3 

Z wyniku widzimy, że w pozycjach 1 , 3 i 4 brakuje wartości w kolumnie „asysty”, a w kolumnie znajdują się łącznie 3 brakujące wartości.

Przykład 2: Policz brakujące wartości we wszystkich kolumnach

Poniższy kod pokazuje, jak policzyć całkowite braki danych w każdej kolumnie ramki danych:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))

    team points assists rebounds 
       1 0 3 1

Z wyniku możemy zobaczyć:

  • W kolumnie „zespół” brakuje 1 wartości.
  • Kolumna „punkty” zawiera 0 brakujących wartości.
  • W kolumnie „pomoc” znajdują się 3 brakujące wartości.
  • W kolumnie „odbicia” brakuje 1 wartości.

Przykład 3: Zlicz brakujące wartości w całej ramce danych

Poniższy kod pokazuje, jak policzyć całkowite braki danych w całej ramce danych:

 #create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
                 points=c(99, 90, 86, 88, 95),
                 assists=c(NA, 28, NA, NA, 34),
                 rebounds=c(30, 28, 24, 24, NA))

#count total missing values in entire data frame
sum( is.na (df))

[1] 5

Z wyniku widzimy, że w całej ramce danych brakuje łącznie 5 wartości.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonać inne typowe operacje na brakujących wartościach w R:

Jak wszystkim przypisać brakujące wartości w R
Jak zamienić NA na ciągi w R
Jak zamienić NA na Zero w dplyr

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *