So führen sie eine listenweise löschung in r durch (mit beispiel)


Das listenweise Löschen ist eine Methode, die alle Zeilen in einem Datenrahmen löscht, in deren Spalte ein Wert fehlt.

Der einfachste Weg, das listenweise Löschen in R durchzuführen, ist die Verwendung der folgenden Syntax:

 complete_df <- df[complete. boxes (df), ]

Diese Syntax verwendet die Funktion „complete.cases()“ , um einen neuen Datenrahmen zu erstellen, der nur die Zeilen aus einem ursprünglichen Datenrahmen enthält, in denen in keiner Spalte Werte fehlen.

Das folgende Beispiel zeigt, wie Sie diese Funktion in der Praxis nutzen können.

Beispiel: Listenweises Löschen in R durchführen

Angenommen, wir haben den folgenden Datenrahmen in R, der Informationen über verschiedene Basketballspieler enthält:

 #create data frame
df <- data. frame (rating=c(70, 75, 75, 78, 81, 85, 89, 91, 94, 97),
                 points=c(12, 15, 14, 13, NA, 29, 24, 18, 20, 25),
                 assists=c(9, 5, NA, 5, 7, 8, 11, 12, 13, 11))

#view data frame
df

   rating points assists
1 70 12 9
2 75 15 5
3 75 14 NA
4 78 13 5
5 81 NA 7
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

Beachten Sie, dass zwei Zeilen in einigen Spalten NA-Werte enthalten.

Wir können die folgende Syntax verwenden, um eine listenweise Löschung durchzuführen und nur die Zeilen zu behalten, in denen in keiner Spalte Werte fehlen:

 #create new data frame that only contains rows with no missing values
complete_df <- df[complete. boxes (df), ]

#view new data frame
complete_df

   rating points assists
1 70 12 9
2 75 15 5
4 78 13 5
6 85 29 8
7 89 24 11
8 91 18 12
9 94 20 13
10 97 25 11

Beachten Sie, dass keine der Zeilen in diesem neuen Datenrahmen in irgendeiner Spalte leere Werte enthält.

Beachten Sie auch, dass wir die Funktion nrow() verwenden könnten, um zu bestimmen, in wie vielen Zeilen im ursprünglichen Datenrahmen in einer Spalte Werte fehlten:

 #count how many rows have missing values in any column
nrow(df[ ! complete. cases (df), ])

[1] 2

Dies sagt uns, dass in zwei Zeilen im ursprünglichen Datenrahmen in mindestens einer Spalte Werte fehlten.

Und wir können genauso einfach zählen, in wie vielen Zeilen in keiner Spalte Werte fehlten:

 #count how many rows do not have missing values in any column
nrow(df[complete. cases (df), ])

[1] 8

Dies sagt uns, dass 8 Zeilen des ursprünglichen Datenrahmens in keiner Spalte fehlende Werte aufwiesen.

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So finden und zählen Sie fehlende Werte in R
So interpolieren Sie fehlende Werte in R

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert