A: hoe drop_na te gebruiken om rijen met ontbrekende waarden neer te zetten


Je kunt de drop_na() functie uit het Tidyr- pakket in R gebruiken om rijen met ontbrekende waarden in een dataframe neer te zetten.

Er zijn drie veelgebruikte manieren om deze functie te gebruiken:

Methode 1: Verwijder rijen met ontbrekende waarden in elke kolom

 df %>% drop_na()

Methode 2: Verwijder rijen met ontbrekende waarden in een specifieke kolom

 df %>% drop_na(col1)

Methode 3: Verwijder rijen met ontbrekende waarden in een van de verschillende specifieke kolommen

 df %>% drop_na(c(col1, col2))

De volgende voorbeelden laten zien hoe u elk van deze methoden in de praktijk kunt gebruiken met het volgende dataframe:

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

Voorbeeld 1: Verwijder rijen met ontbrekende waarden in een willekeurige kolom

De volgende code laat zien hoe je drop_na() gebruikt om rijen met ontbrekende waarden in elke kolom neer te zetten:

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

De enige rijen die overblijven zijn de rijen die in geen enkele kolom ontbrekende waarden bevatten.

Voorbeeld 2: Verwijder rijen met ontbrekende waarden in een specifieke kolom

De volgende code laat zien hoe je drop_na() gebruikt om rijen met ontbrekende waarden in de bouncekolom te verwijderen:

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

De enige rijen die overblijven zijn de rijen zonder ontbrekende waarden in de bouncekolom .

Voorbeeld 3: Verwijder rijen met ontbrekende waarden in een van meerdere specifieke kolommen

De volgende code laat zien hoe je drop_na() gebruikt om rijen met ontbrekende waarden in de punten- of hulpkolommen neer te zetten:

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

De enige rijen die overblijven zijn de rijen zonder ontbrekende waarden in de punten- of assist- kolommen.

Opmerking: u kunt hier de volledige online documentatie voor de drop_na()- methode vinden.

Aanvullende bronnen

In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:

Regelnummers ophalen in R
Rijen toevoegen aan een dataframe in R
Hoe u een functie toepast op elke rij dataframes in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert