Jak wykonać usuwanie listowe w r (z przykładem)
Usuwanie metodą listową to metoda usuwająca wszystkie wiersze w ramce danych, w których brakuje wartości w kolumnie .
Najłatwiejszym sposobem usunięcia listowego w R jest użycie następującej składni:
complete_df <- df[complete. boxes (df), ]
Ta składnia wykorzystuje funkcjęcomplete.cases () w celu utworzenia nowej ramki danych zawierającej tylko te wiersze z oryginalnej ramki danych, które nie zawierają brakujących wartości w żadnej kolumnie.
Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.
Przykład: Wykonaj usuwanie listowe w R
Załóżmy, że mamy następującą ramkę danych w R, która zawiera informacje o różnych koszykarzach:
#create data frame df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97), points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25), assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11)) #view data frame df rating points assists 1 70 12 9 2 75 15 5 3 75 14 NA 4 78 13 5 5 81 NA 7 6 85 29 8 7 89 24 11 8 91 18 12 9 94 20 13 10 97 25 11
Zauważ, że w niektórych kolumnach dwa wiersze zawierają wartości NA.
Możemy użyć następującej składni, aby wykonać usuwanie listowe i zachować tylko te wiersze, które nie mają brakujących wartości w żadnej kolumnie:
#create new data frame that only contains rows with no missing values complete_df <- df[complete. boxes (df), ] #view new data frame complete_df rating points assists 1 70 12 9 2 75 15 5 4 78 13 5 6 85 29 8 7 89 24 11 8 91 18 12 9 94 20 13 10 97 25 11
Zwróć uwagę, że żaden z wierszy tej nowej ramki danych nie ma pustych wartości w żadnej kolumnie.
Zauważ też, że możemy użyć funkcji nrow() do określenia, w ilu wierszach oryginalnej ramki danych w dowolnej kolumnie brakuje wartości:
#count how many rows have missing values in any column nrow(df[ ! complete. cases (df), ]) [1] 2
To mówi nam, że w 2 wierszach oryginalnej ramki danych brakowało wartości w co najmniej jednej kolumnie.
Równie łatwo możemy policzyć, ile wierszy nie zawierało brakujących wartości w żadnej kolumnie:
#count how many rows do not have missing values in any column nrow(df[complete. cases (df), ]) [1] 8
To mówi nam, że 8 wierszy oryginalnej ramki danych nie zawierało brakujących wartości w żadnej kolumnie.
Dodatkowe zasoby
Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:
Jak znaleźć i policzyć brakujące wartości w R
Jak interpolować brakujące wartości w R