Rijen verwijderen met enkele of alle na's in r


Vaak wilt u misschien rijen verwijderen die enkele of alle NA’s (ontbrekende waarden) bevatten in een dataframe in R.

In deze tutorial wordt uitgelegd hoe u deze regels kunt verwijderen met Basic R en het Tidyr- pakket. We zullen het volgende dataframe gebruiken voor elk van de volgende voorbeelden:

 #create data frame with some missing values
df <- data.frame(points = c(12, NA, 19, 22, 32),
                 assists = c(4, NA, 3, NA, 5),
                 rebounds = c(5, NA, 7, 12, NA))

#view data frame
df

  points assists rebounds
1 12 4 5
2 NA NA NA
3 19 3 7
4 22 NA 12
5 32 5 NA

Verwijder NA’s met Base R

De volgende code laat zien hoe u complete.cases() kunt gebruiken om alle rijen in een dataframe te verwijderen die een ontbrekende waarde in een kolom hebben:

 #remove all rows with a missing value in any column
df[ complete.cases (df),]

  points assists rebounds
1 12 4 5
3 19 3 7

De volgende code laat zien hoe u complete.cases() kunt gebruiken om alle rijen in een dataframe te verwijderen die een ontbrekende waarde hebben in specifieke kolommen:

 #remove all rows with a missing value in the third column
df[ complete.cases (df[,3]),]

  points assists rebounds
1 12 4 5
3 19 3 7
4 22 NA 12

#remove all rows with a missing value in either the first or third column
df[ complete.cases (df[ , c(1,3)]),]

  points assists rebounds
1 12 4 5
3 19 3 7
4 22 NA 12

Verwijder NA’s met Tidyr

De volgende code laat zien hoe je drop_na() uit het Tidyr-pakket gebruikt om alle rijen in een dataframe te verwijderen die een ontbrekende waarde in een kolom hebben:

 #load tidyr package
library(tidyr)

#remove all rows with a missing value in any column
df %>% drop_na()

  points assists rebounds
1 12 4 5
3 19 3 7

De volgende code laat zien hoe je drop_na() uit het Tidyr-pakket kunt gebruiken om alle rijen in een dataframe te verwijderen die een ontbrekende waarde hebben in specifieke kolommen:

 #load tidyr package
library(tidyr)

#remove all rows with a missing value in the third column
df %>% drop_na(rebounds)

  points assists rebounds
1 12 4 5
3 19 3 7
4 22 NA 12

Meer R-tutorials vindt u hier .

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert