Lijstsgewijs verwijderen uitvoeren in r (met voorbeeld)
Lijstsgewijs verwijderen is een methode die alle rijen in een dataframe verwijdert die een ontbrekende waarde in een kolom hebben.
De eenvoudigste manier om lijstgewijze verwijdering uit te voeren in R is door de volgende syntaxis te gebruiken:
complete_df <- df[complete. boxes (df), ]
Deze syntaxis gebruikt de functie complete.cases() om een nieuw dataframe te maken dat alleen die rijen uit een origineel dataframe bevat die in geen enkele kolom ontbrekende waarden hebben.
Het volgende voorbeeld laat zien hoe u deze functie in de praktijk kunt gebruiken.
Voorbeeld: Voer lijstgewijze verwijdering uit in R
Stel dat we het volgende dataframe in R hebben dat informatie bevat over verschillende basketbalspelers:
#create data frame df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97), points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25), assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11)) #view data frame df rating points assists 1 70 12 9 2 75 15 5 3 75 14 NA 4 78 13 5 5 81 NA 7 6 85 29 8 7 89 24 11 8 91 18 12 9 94 20 13 10 97 25 11
Merk op dat twee rijen in sommige kolommen NA-waarden bevatten.
We kunnen de volgende syntaxis gebruiken om een lijstgewijze verwijdering uit te voeren en alleen de rijen te behouden die in geen enkele kolom ontbreken:
#create new data frame that only contains rows with no missing values complete_df <- df[complete. boxes (df), ] #view new data frame complete_df rating points assists 1 70 12 9 2 75 15 5 4 78 13 5 6 85 29 8 7 89 24 11 8 91 18 12 9 94 20 13 10 97 25 11
Houd er rekening mee dat geen van de rijen in dit nieuwe dataframe lege waarden in kolommen heeft.
Merk ook op dat we de functie nrow() konden gebruiken om te bepalen hoeveel rijen in het originele dataframe ontbrekende waarden in welke kolom dan ook hadden:
#count how many rows have missing values in any column nrow(df[ ! complete. cases (df), ]) [1] 2
Dit vertelt ons dat twee rijen in het oorspronkelijke dataframe ontbrekende waarden hadden in ten minste één kolom.
En we kunnen net zo gemakkelijk tellen hoeveel rijen in welke kolom dan ook geen ontbrekende waarden hadden:
#count how many rows do not have missing values in any column nrow(df[complete. cases (df), ]) [1] 8
Dit vertelt ons dat 8 rijen van het originele dataframe in geen enkele kolom ontbrekende waarden hadden.
Aanvullende bronnen
In de volgende tutorials wordt uitgelegd hoe u andere veelvoorkomende taken in R kunt uitvoeren:
Hoe ontbrekende waarden in R te vinden en te tellen
Hoe ontbrekende waarden in R te interpoleren