Jak wykonać usuwanie listowe w r (z przykładem)


Usuwanie metodą listową to metoda usuwająca wszystkie wiersze w ramce danych, w których brakuje wartości w kolumnie .

Najłatwiejszym sposobem usunięcia listowego w R jest użycie następującej składni:

 complete_df <- df[complete. boxes (df), ]

Ta składnia wykorzystuje funkcjęcomplete.cases () w celu utworzenia nowej ramki danych zawierającej tylko te wiersze z oryginalnej ramki danych, które nie zawierają brakujących wartości w żadnej kolumnie.

Poniższy przykład pokazuje, jak w praktyce wykorzystać tę funkcję.

Przykład: Wykonaj usuwanie listowe w R

Załóżmy, że mamy następującą ramkę danych w R, która zawiera informacje o różnych koszykarzach:

 #create data frame
df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97),
                 points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25),
                 assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11))

#view data frame
df

   rating points assists
1 70 12 9
2 75 15 5
3 75 14 NA
4 78 13 5
5 81 NA 7
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

Zauważ, że w niektórych kolumnach dwa wiersze zawierają wartości NA.

Możemy użyć następującej składni, aby wykonać usuwanie listowe i zachować tylko te wiersze, które nie mają brakujących wartości w żadnej kolumnie:

 #create new data frame that only contains rows with no missing values
complete_df <- df[complete. boxes (df), ]

#view new data frame
complete_df

   rating points assists
1 70 12 9
2 75 15 5
4 78 13 5
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

Zwróć uwagę, że żaden z wierszy tej nowej ramki danych nie ma pustych wartości w żadnej kolumnie.

Zauważ też, że możemy użyć funkcji nrow() do określenia, w ilu wierszach oryginalnej ramki danych w dowolnej kolumnie brakuje wartości:

 #count how many rows have missing values in any column
nrow(df[ ! complete. cases (df), ])

[1] 2

To mówi nam, że w 2 wierszach oryginalnej ramki danych brakowało wartości w co najmniej jednej kolumnie.

Równie łatwo możemy policzyć, ile wierszy nie zawierało brakujących wartości w żadnej kolumnie:

 #count how many rows do not have missing values in any column
nrow(df[complete. cases (df), ])

[1] 8

To mówi nam, że 8 wierszy oryginalnej ramki danych nie zawierało brakujących wartości w żadnej kolumnie.

Dodatkowe zasoby

Poniższe samouczki wyjaśniają, jak wykonywać inne typowe zadania w języku R:

Jak znaleźć i policzyć brakujące wartości w R
Jak interpolować brakujące wartości w R

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *