A: zeilen basierend auf der bedingung aus dem datenrahmen löschen
Sie können die Funktion subset() verwenden, um Zeilen mit bestimmten Werten in einem Datenrahmen in R zu entfernen:
#only keep rows where col1 value is less than 10 and col2 value is less than 8 new_df <- subset(df, col1 < 10 & col2< 8 )
Die folgenden Beispiele zeigen, wie diese Syntax in der Praxis mit dem folgenden Datenrahmen verwendet werden kann:
#create data frame
df <- data. frame (a=c(1, 3, 4, 6, 8, 9),
b=c(7, 8, 8, 7, 13, 16),
c=c(11, 13, 13, 18, 19, 22),
d=c(12, 16, 18, 22, 29, 38))
#view data frame
df
abcd
1 1 7 11 12
2 3 8 13 16
3 4 8 13 18
4 6 7 18 22
5 8 13 19 29
6 9 16 22 38
Beispiel 1: Zeilen löschen, die einem bestimmten Wert entsprechen
Der folgende Code zeigt, wie alle Zeilen gelöscht werden, deren Wert in Spalte „c“ gleich 13 ist:
#remove rows where column 'c' is equal to 13 new_df <- subset(df, c != 13) #view updated data frame new_df abcd 1 1 7 11 12 4 6 7 18 22 5 8 13 19 29 6 9 16 22 38
Beispiel 2: Zeilen löschen, die einem von mehreren Werten entsprechen
Der folgende Code zeigt, wie alle Zeilen gelöscht werden, deren Wert in Spalte „b“ gleich 7 oder 8 ist:
#remove rows where value in column b is equal to 7 or 8 new_df <- subset(df, ! (b %in% c(7, 8))) #view updated data frame new_df abcd 5 8 13 19 29 6 9 16 22 38
Beispiel 3: Zeilen basierend auf mehreren Bedingungen löschen
Der folgende Code zeigt, wie alle Zeilen gelöscht werden, in denen der Wert der Spalte „b“ gleich 7 oder der Wert der Spalte „d“ gleich 38 ist:
#remove rows where value in column b is 7 or value in column d is 38 new_df <- subset(df, b != 7 & d != 38) #view updated data frame new_df abcd 2 3 8 13 16 3 4 8 13 18 5 8 13 19 29
Zusätzliche Ressourcen
So entfernen Sie doppelte Zeilen in R
So verwenden Sie den %in%-Operator in R
So kodieren Sie Werte in R neu