A: entfernen sie spalten, wenn der name eine bestimmte zeichenfolge enthält


Mit den folgenden Methoden können Sie Spalten aus einem Datenrahmen in R entfernen, deren Name bestimmte Zeichenfolgen enthält:

Methode 1: Spalten entfernen, wenn der Name eine bestimmte Zeichenfolge enthält

 library (dplyr)

df_new <- df %>% select(-contains(' this_string '))

Methode 2: Spalten entfernen, wenn der Name eine von mehreren spezifischen Zeichenfolgen enthält

 library (dplyr)

df_new <- df %>% select(-contains(c(' string1 ', ' string2 ', ' string3 ')))

Die folgenden Beispiele zeigen, wie jede Methode in der Praxis mit dem folgenden Datenrahmen in R verwendet wird:

 #create data frame
df <- data. frame (team_name=c('A', 'B', 'C', 'D', 'E', 'F'),
                 team_location=c('AU', 'AU', 'EU', 'EU', 'AU', 'EU'),
                 player_name=c('Andy', 'Bob', 'Chad', 'Dan', 'Ed', 'Fran'),
                 dots=c(22, 29, 35, 30, 18, 12))

#view data frame
df

  team_name team_location player_name points
1 A AU Andy 22
2 B AU Bob 29
3 C EU Chad 35
4 D EU Dan 30
5 E TO Ed 18
6 F EU Fran 12

Beispiel 1: Spalten entfernen, wenn der Name eine bestimmte Zeichenfolge enthält

Wir können die folgende Syntax verwenden, um alle Spalten aus dem Datenrahmen zu entfernen, die „team“ irgendwo im Spaltennamen enthalten:

 library (dplyr)

#drop columns that contain 'team'
df_new <- df %>% select(-contains(' team '))

#view new data frame
df_new

  player_name points
1 Andy 22
2 Bob 29
3 Chad 35
4 Dan 30
5 Ed 18
6 Fran 12

Beachten Sie, dass die beiden Spalten, die „team“ im Namen enthalten, aus dem Datenrahmen entfernt wurden.

Beispiel 2: Spalten entfernen, wenn der Name eine von mehreren spezifischen Zeichenfolgen enthält

Mit der folgenden Syntax können wir alle Spalten aus dem Datenrahmen entfernen, die irgendwo im Spaltennamen „Spieler“ oder „Punkte“ enthalten:

 #drop columns whose name contains 'player' or 'points'
df_new <- df %>% select(-contains(c(' player ', ' points ')))

#view new data frame
df

  team_name team_location
1 A AU
2 B AU
3 C EU
4 D EU
5 E AU
6 F EU

Beachten Sie, dass die beiden Spalten, die „Spieler“ oder „Punkte“ im Namen enthalten, aus dem Datenrahmen entfernt wurden.

Hinweis : Die vollständige Dokumentation für die Funktion dplyr select() finden Sie hier .

Zusätzliche Ressourcen

In den folgenden Tutorials wird erläutert, wie Sie andere häufige Aufgaben in R ausführen:

So löschen Sie Spalten nach Namen in R
So behalten Sie bestimmte Spalten in R bei
So benennen Sie Datenrahmenspalten in R um

Einen Kommentar hinzufügen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert