A: so verwenden sie drop_na, um zeilen mit fehlenden werten zu löschen
Sie können die Funktion drop_na() aus dem Tidyr- Paket in R verwenden, um Zeilen mit fehlenden Werten in einem Datenrahmen zu löschen.
Es gibt drei gängige Möglichkeiten, diese Funktion zu verwenden:
Methode 1: Zeilen mit fehlenden Werten in einer beliebigen Spalte entfernen
df %>% drop_na()
Methode 2: Zeilen mit fehlenden Werten in einer bestimmten Spalte entfernen
df %>% drop_na(col1)
Methode 3: Zeilen mit fehlenden Werten in einer von mehreren spezifischen Spalten entfernen
df %>% drop_na(c(col1, col2))
Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis mit dem folgenden Datenrahmen verwendet wird:
#create data frame df <- data. frame (points=c(10, NA, 15, 15, 14, 16), assists=c(4, NA, 4, NA, 9, 3), rebounds=c(NA, 5, 10, 7, 7, NA)) #view data frame df points assists rebounds 1 10 4 NA 2 NA NA 5 3 15 4 10 4 15 NA 7 5 14 9 7 6 16 3 NA
Beispiel 1: Zeilen mit fehlenden Werten in einer beliebigen Spalte löschen
Der folgende Code zeigt, wie man drop_na() verwendet, um Zeilen mit fehlenden Werten in einer beliebigen Spalte zu löschen:
library (tidyr)
#drop rows with missing values in any column
df %>% drop_na()
points assists rebounds
1 15 4 10
2 14 9 7
Es bleiben nur noch die Zeilen übrig, die in keiner Spalte fehlende Werte enthalten.
Beispiel 2: Zeilen mit fehlenden Werten in einer bestimmten Spalte entfernen
Der folgende Code zeigt, wie man drop_na() verwendet, um Zeilen mit fehlenden Werten in der Bounces- Spalte zu entfernen:
library (tidyr)
#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)
points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7
Die einzigen verbleibenden Zeilen sind diejenigen ohne fehlende Werte in der Spalte „Bounces“ .
Beispiel 3: Zeilen mit fehlenden Werten in einer von mehreren spezifischen Spalten löschen
Der folgende Code zeigt, wie man drop_na() verwendet, um Zeilen mit fehlenden Werten in den Punkte- oder Assists -Spalten zu löschen:
library (tidyr)
#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))
points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA
Die einzigen verbleibenden Zeilen sind diejenigen ohne fehlende Werte in den Punkte- oder Assists- Spalten.
Hinweis: Die vollständige Online-Dokumentation zur Methode drop_na() finden Sie hier .
Zusätzliche Ressourcen
Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:
So rufen Sie Zeilennummern in R ab
So fügen Sie Zeilen zu einem Datenrahmen in R hinzu
So wenden Sie eine Funktion auf jede Zeile des Datenrahmens in R an