A: hoe drop_na te gebruiken om rijen met ontbrekende waarden neer te zetten
Je kunt de drop_na() functie uit het Tidyr- pakket in R gebruiken om rijen met ontbrekende waarden in een dataframe neer te zetten.
Er zijn drie veelgebruikte manieren om deze functie te gebruiken:
Methode 1: Verwijder rijen met ontbrekende waarden in elke kolom
df %>% drop_na()
Methode 2: Verwijder rijen met ontbrekende waarden in een specifieke kolom
df %>% drop_na(col1)
Methode 3: Verwijder rijen met ontbrekende waarden in een van de verschillende specifieke kolommen
df %>% drop_na(c(col1, col2))
De volgende voorbeelden laten zien hoe u elk van deze methoden in de praktijk kunt gebruiken met het volgende dataframe:
#create data frame df <- data. frame (points=c(10, NA, 15, 15, 14, 16), assists=c(4, NA, 4, NA, 9, 3), rebounds=c(NA, 5, 10, 7, 7, NA)) #view data frame df points assists rebounds 1 10 4 NA 2 NA NA 5 3 15 4 10 4 15 NA 7 5 14 9 7 6 16 3 NA
Voorbeeld 1: Verwijder rijen met ontbrekende waarden in een willekeurige kolom
De volgende code laat zien hoe je drop_na() gebruikt om rijen met ontbrekende waarden in elke kolom neer te zetten:
library (tidyr)
#drop rows with missing values in any column
df %>% drop_na()
points assists rebounds
1 15 4 10
2 14 9 7
De enige rijen die overblijven zijn de rijen die in geen enkele kolom ontbrekende waarden bevatten.
Voorbeeld 2: Verwijder rijen met ontbrekende waarden in een specifieke kolom
De volgende code laat zien hoe je drop_na() gebruikt om rijen met ontbrekende waarden in de bouncekolom te verwijderen:
library (tidyr)
#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)
points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7
De enige rijen die overblijven zijn de rijen zonder ontbrekende waarden in de bouncekolom .
Voorbeeld 3: Verwijder rijen met ontbrekende waarden in een van meerdere specifieke kolommen
De volgende code laat zien hoe je drop_na() gebruikt om rijen met ontbrekende waarden in de punten- of hulpkolommen neer te zetten:
library (tidyr)
#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))
points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA
De enige rijen die overblijven zijn de rijen zonder ontbrekende waarden in de punten- of assist- kolommen.
Opmerking: u kunt hier de volledige online documentatie voor de drop_na()- methode vinden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Regelnummers ophalen in R
Rijen toevoegen aan een dataframe in R
Hoe u een functie toepast op elke rij dataframes in R