Jak znaleźć i policzyć brakujące wartości w r (z przykładami)
Aby znaleźć i policzyć brakujące wartości w R, możesz użyć następujących metod:
Metoda 1: Znajdź lokalizację brakujących wartości
which( is.na (df$column_name))
Metoda 2: Policz wszystkie brakujące wartości
sum( is.na (df$column_name))
Poniższe przykłady pokazują, jak wykorzystać te funkcje w praktyce.
Przykład 1: Znajdź i zlicz brakujące wartości w kolumnie
Załóżmy, że mamy następującą ramkę danych:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(NA, 28, NA, NA, 34),
rebounds=c(30, 28, 24, 24, NA))
#view data frame
df
team points assists rebounds
1 A 99 NA 30
2 B 90 28 28
3 C 86 NA 24
4 NA 88 NA 24
5 E 95 34 NA
Możemy użyć poniższego kodu, aby zidentyfikować pozycje, które mają braki danych w kolumnie „pomoc” i znaleźć łączną liczbę brakujących wartości w kolumnie „pomoc”:
#identify locations of missing values in 'assists' column
which( is.na (df$assists))
[1] 1 3 4
#count total missing values in 'assists' column
sum( is.na (df$assists))
[1] 3
Z wyniku widzimy, że w pozycjach 1 , 3 i 4 brakuje wartości w kolumnie „asysty”, a w kolumnie znajdują się łącznie 3 brakujące wartości.
Przykład 2: Policz brakujące wartości we wszystkich kolumnach
Poniższy kod pokazuje, jak policzyć całkowite braki danych w każdej kolumnie ramki danych:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(NA, 28, NA, NA, 34),
rebounds=c(30, 28, 24, 24, NA))
#count total missing values in each column of data frame
sapply(df, function (x) sum(is. na (x)))
team points assists rebounds
1 0 3 1
Z wyniku możemy zobaczyć:
- W kolumnie „zespół” brakuje 1 wartości.
- Kolumna „punkty” zawiera 0 brakujących wartości.
- W kolumnie „pomoc” znajdują się 3 brakujące wartości.
- W kolumnie „odbicia” brakuje 1 wartości.
Przykład 3: Zlicz brakujące wartości w całej ramce danych
Poniższy kod pokazuje, jak policzyć całkowite braki danych w całej ramce danych:
#create data frame
df <- data. frame (team=c('A', 'B', 'C', NA, 'E'),
points=c(99, 90, 86, 88, 95),
assists=c(NA, 28, NA, NA, 34),
rebounds=c(30, 28, 24, 24, NA))
#count total missing values in entire data frame
sum( is.na (df))
[1] 5
Z wyniku widzimy, że w całej ramce danych brakuje łącznie 5 wartości.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonać inne typowe operacje na brakujących wartościach w R:
Jak wszystkim przypisać brakujące wartości w R
Jak zamienić NA na ciągi w R
Jak zamienić NA na Zero w dplyr