A: so verwenden sie drop_na, um zeilen mit fehlenden werten zu löschen


Sie können die Funktion drop_na() aus dem Tidyr- Paket in R verwenden, um Zeilen mit fehlenden Werten in einem Datenrahmen zu löschen.

Es gibt drei gängige Möglichkeiten, diese Funktion zu verwenden:

Methode 1: Zeilen mit fehlenden Werten in einer beliebigen Spalte entfernen

 df %>% drop_na()

Methode 2: Zeilen mit fehlenden Werten in einer bestimmten Spalte entfernen

 df %>% drop_na(col1)

Methode 3: Zeilen mit fehlenden Werten in einer von mehreren spezifischen Spalten entfernen

 df %>% drop_na(c(col1, col2))

Die folgenden Beispiele zeigen, wie jede dieser Methoden in der Praxis mit dem folgenden Datenrahmen verwendet wird:

 #create data frame
df <- data. frame (points=c(10, NA, 15, 15, 14, 16),
                 assists=c(4, NA, 4, NA, 9, 3),
                 rebounds=c(NA, 5, 10, 7, 7, NA))

#view data frame
df

  points assists rebounds
1 10 4 NA
2 NA NA 5
3 15 4 10
4 15 NA 7
5 14 9 7
6 16 3 NA

Beispiel 1: Zeilen mit fehlenden Werten in einer beliebigen Spalte löschen

Der folgende Code zeigt, wie man drop_na() verwendet, um Zeilen mit fehlenden Werten in einer beliebigen Spalte zu löschen:

 library (tidyr)

#drop rows with missing values in any column
df %>% drop_na()

  points assists rebounds
1 15 4 10
2 14 9 7

Es bleiben nur noch die Zeilen übrig, die in keiner Spalte fehlende Werte enthalten.

Beispiel 2: Zeilen mit fehlenden Werten in einer bestimmten Spalte entfernen

Der folgende Code zeigt, wie man drop_na() verwendet, um Zeilen mit fehlenden Werten in der Bounces- Spalte zu entfernen:

 library (tidyr)

#drop rows with missing values in rebounds column
df %>% drop_na(rebounds)

  points assists rebounds
1 NA NA 5
2 15 4 10
3 15 NA 7
4 14 9 7

Die einzigen verbleibenden Zeilen sind diejenigen ohne fehlende Werte in der Spalte „Bounces“ .

Beispiel 3: Zeilen mit fehlenden Werten in einer von mehreren spezifischen Spalten löschen

Der folgende Code zeigt, wie man drop_na() verwendet, um Zeilen mit fehlenden Werten in den Punkte- oder Assists -Spalten zu löschen:

 library (tidyr)

#drop rows with missing values in the points or assists columns
df %>% drop_na(c(points, assists))

  points assists rebounds
1 10 4 NA
2 15 4 10
3 14 9 7
4 16 3 NA

Die einzigen verbleibenden Zeilen sind diejenigen ohne fehlende Werte in den Punkte- oder Assists- Spalten.

Hinweis: Die vollständige Online-Dokumentation zur Methode drop_na() finden Sie hier .

Zusätzliche Ressourcen

Die folgenden Tutorials erklären, wie Sie andere häufige Aufgaben in R ausführen:

So rufen Sie Zeilennummern in R ab
So fügen Sie Zeilen zu einem Datenrahmen in R hinzu
So wenden Sie eine Funktion auf jede Zeile des Datenrahmens in R an

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert